<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif">Hi Patrick,</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Thank you so much for getting back to me. <b>The Lustre installation was 2.9.0.</b> I am working to run the workloads on Lustre 2.12 release.<br><br>I have 1 machine for MGS and MDS and 4 machines for OSS. In each OSS, I have 2 OSTs and each of them is 200 GiB in size. All the OSTs are mounted on SSD. The striping layout is the default one. Since for the workload, we have one large file of 5 GiB in size, the whole resides in a single OST. We also verified that by looking at the rpc_stats.<br><br><img src="cid:ii_l1cdgirg1" alt="image.png" width="516" height="153"><br><br>Following is the hardware configuration for all the machines.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br><img src="cid:ii_l1cdd8tm0" alt="image.png" width="516" height="139"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Please let me know if you need further information.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Thanks,</div><div class="gmail_default" style="font-family:verdana,sans-serif">Hasan</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sun, Mar 27, 2022 at 1:54 PM Patrick Farrell <<a href="mailto:pfarrell@ddn.com">pfarrell@ddn.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">




<div dir="ltr">[<strong><font color="red">Caution</font></strong>: Email from External Sender. Do not click or open links or attachments unless you know this sender.]<br><span> </span>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
Hasan,</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
Historically, there have been several bugs related to write grant when max_dirty_mb is set to large values (depending on a few other details of system setup).</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
Write grant allows the client to write data in to memory and write it out asynchronously.  When write grant is not available to the client, the client is forced to do sync writes at small sizes.  The result looks exactly like this, write performance drops severely.</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
Depending on what version you're running, you may not have fixes for these bugs.  You could either try a newer Lustre version (you didn't mention what you're running) or just use a smaller value of max_dirty_mb.</div>
<div></div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
I am surprised to see you're still seeing a speedup from max_dirty_mb values over 1 GiB in size.<br>
<br>
Can you describe your system a bit more?  How many OSTs do you have and how many stripes are you using?  max_dirty_mb is a per OST value on the client, not a global one.</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
<br>
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
-Patrick</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
</div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
</div>
<div id="gmail-m_-2937072809918361995appendonsend"></div>
<hr style="display:inline-block;width:98%">
<div id="gmail-m_-2937072809918361995divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" style="font-size:11pt" color="#000000"><b>From:</b> lustre-discuss <<a href="mailto:lustre-discuss-bounces@lists.lustre.org" target="_blank">lustre-discuss-bounces@lists.lustre.org</a>> on behalf of Hasan Rashid via lustre-discuss <<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a>><br>
<b>Sent:</b> Friday, March 25, 2022 11:45 AM<br>
<b>To:</b> <a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a> <<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a>><br>
<b>Subject:</b> [lustre-discuss] Write Performance is Abnormal for max_dirty_mb Value of 2047</font>
<div> </div>
</div>
<div>
<div dir="ltr">
<div style="font-family:verdana,sans-serif">Hi Everyone,<br>
</div>
<div style="font-family:verdana,sans-serif"><br>
</div>
<div style="font-family:verdana,sans-serif">As the manual suggests, the valid value range for max_dirty_mb is the values larger than 0 and smaller than the lesser of 2048 MiB or 1/4 of client RAM. In my system, the client's RAM is 196
 GiB.<b> So, the maximum valid value for max_dirty_mb(mdm) is 2047 MiB.</b></div>
<div style="font-family:verdana,sans-serif"><br>
</div>
<div style="font-family:verdana,sans-serif">However, when we set the max_dirty_mb value to 2047,
<b>we see very low write throughput for multiple Filebench workloads that we have tested so far</b>. I am providing details for one example of the tested workload below.</div>
<div style="font-family:verdana,sans-serif"><br>
</div>
<div style="font-family:verdana,sans-serif"><b><u>Workload Detail:</u></b> We are doing only random write operation of 1MiB size from one process and one thread to a single large file of 5GiB size.</div>
<div style="font-family:verdana,sans-serif"><br>
</div>
<div style="font-family:verdana,sans-serif"><b><u>Observed Result:</u></b> As you can see from the below diagram, as we increase the mdm value from 768 to 1792 by an amount of 256 in each step, the write throughput has increased gradually.
 However, for the mdm value of 2047, the result dropped very significantly. The observation holds true for all the workloads we tested so far.</div>
<div style="font-family:verdana,sans-serif"><br>
</div>
<div style="font-family:verdana,sans-serif"><br>
</div>
<div style="font-family:verdana,sans-serif"><span id="gmail-m_-2937072809918361995x_gmail-docs-internal-guid-18e99bf1-7fff-815f-a4c8-b3622739cea4"><span style="font-size:20pt;font-family:Arial;color:rgb(0,0,0);background-color:transparent;font-variant-numeric:normal;font-variant-east-asian:normal;vertical-align:baseline;white-space:pre-wrap"><span style="border:none;display:inline-block;overflow:hidden;width:280px;height:277px"><img width="280" height="277" style="margin-left: 0px; margin-top: 0px;" src="https://lh3.googleusercontent.com/iEqpGNZhI9r9jJCLq0rWPvFADJRXkKKKZnyCV_8m3nhiHggNqWU9d_7WTUU0yeb011nxjULF4_iLkI7TIc0qe5el11PJI3i9Jot9KveXUil98A_UEnBojFqAHfK94ve1foQT39m2"></span></span></span><br>
</div>
<div style="font-family:verdana,sans-serif"><br>
</div>
<div style="font-family:verdana,sans-serif">I am unable to figure out why we would have such low performance at the mdm value of 2047. Please share any insights you have that would be helpful for me to understand the aforementioned scenario.</div>
<div style="font-family:verdana,sans-serif"><br>
</div>
<div style="font-family:verdana,sans-serif">Best Wishes,</div>
<div style="font-family:verdana,sans-serif">Md Hasanur Rashid</div>
</div>
</div>
</div>

</blockquote></div>