<div dir="ltr">Just my $0.02 here.<div><br></div><div>I am in agreement with Mr. A. Dilger.  I am a vote in favor of the present Lustre default behavior.   The pausing of operations is a good Lustre feature for us.   I have worked with various systems in which a network hiccup will not crash the job. In the present Lustre behavior; the job will just pause for a bit (a configurable number, if I recall correctly).  We have left the default value in place.  It prevents us from having jobs fail because of momentary (one minute or less) holds in the network traffic.</div>
<div><br></div><div>If Yao wishes it to be a shorter time to failing the job, I think he should have the freedom to configure the value that works for him.  </div><div><br></div><div>My opinion, YMMV.</div><div>Cheers,</div>
<div>megan</div></div>