Our MDT have lustre 1.6.7, I see in this message <a href="http://lists.lustre.org/pipermail/lustre-discuss/2009-April/010167.html" target="_blank">http://lists.lustre.org/pipermail/lustre-discuss/2009-April/010167.html</a> that this version have a bug that cause directory corruptions on the MDT. Can this bug produce this kind of errors? <br>
<pre><br></pre><br><br><div class="gmail_quote">2009/8/17 Oleg Drokin <span dir="ltr"><<a href="mailto:Oleg.Drokin@sun.com">Oleg.Drokin@sun.com</a>></span><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hello!<div class="im"><br>
<br>
On Aug 17, 2009, at 2:14 PM, Patricia Santos Marco wrote:<br>
<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
The last day our MDS refusing conections too. The logs are the same, and we should reboot the MDS server . What's is the reason for this?<br>
</blockquote>
<br></div>
That means some requests from this client are still being processed and server has a self-preservation mechanism trying to protect itself<br>
from client resending same rpc (that leads to slow server processing if not worse) again and again and occupying<br>
more and more server threads.<br>
The hung threads either had lbug that you can see in the logs or watchdogs should have triggered showing what it was doing<br>
(also visible in logs) before clients time out.<br>
<br>
Bye,<br><font color="#888888">
    Oleg<br>
</font></blockquote></div><br><br clear="all"><br>-- <br>(\__/)<br>( O.o)<br>( > <) Este es conejo.<br>Copia a conejo en tu firma y ayudalo en sus planes de dominación mundial.<br><br>