<div dir="ltr">G'Day all,<div><br></div><div>As I reportedĀ in a previous email my OSS nodes crash soon after initiating a file creation script using "dd" in a loop and then trying to delete all the files at once.</div><div><br></div><div>At first I thought it was related to the Melanox 100G cards but after rebuilding everything using just the 10G network I still get the crashes. I have a crash dump file from the MDS which crashed during the creates and the OSS crashed when I did the deletes.</div><div><br></div><div>This leads me to think Lustre 2.12.6 running on Centos 7.9 has a subtle bug somewhere?</div><div><br></div><div>I'm not sure how to progress this, should I attempt to try 2.13?</div><div><a href="https://downloads.whamcloud.com/public/lustre/lustre-2.13.0/el7/patchless-ldiskfs-server/RPMS/x86_64/">https://downloads.whamcloud.com/public/lustre/lustre-2.13.0/el7/patchless-ldiskfs-server/RPMS/x86_64/</a><br></div><div><br></div><div>Or build a fresh instance on a clean build of the OS?</div><div><br></div><div>Thoughts?</div><div><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div><br></div><div><br></div><div>Sid Young</div><div><br></div></div></div></div></div></div></div></div></div></div></div></div>