The last day our MDS refusing conections too. The logs are the same, and we should reboot the MDS server . What's is the reason for this?<br><br><div class="gmail_quote">2009/3/5 Thomas Roth <span dir="ltr"><<a href="mailto:t.roth@gsi.de">t.roth@gsi.de</a>></span><br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Hi all,<br>
<br>
after running for days without any problems, our MDS is refusing<br>
cooperation for two hours now.<br>
The log files show nothing until<br>
>Mar  5 16:46:24 mds1 kernel: Lustre:<br>
17841:0:(ldlm_lib.c:525:target_handle_reconnect()) MDT0000: 481fa70b-590d<br>
-31b6-f621-c6125a54bfff reconnecting<br>
>Mar  5 16:46:24 mds1 kernel: Lustre:<br>
17841:0:(ldlm_lib.c:760:target_handle_connect()) MDT0000: refuse reconnec<br>
tion from <a href="mailto:481fa70b-590d-31b6-f621-c6125a54bfff@1.2.3.4">481fa70b-590d-31b6-f621-c6125a54bfff@1.2.3.4</a>@tcp to<br>
0xffff8107ef44a000; still busy with 2 active RPCs<br>
<br>
I thought that such a thing would be between the MDT and this particular<br>
client. However, the log goes on like that with many other clients.<br>
<br>
Now the MDS is refusing any connection, bringing the system to a stand<br>
still.<br>
<br>
The situation also triggered the dumping of ca. 130 log dumps to /tmp.<br>
Most of these are small and contain just<br>
>Watchdog triggered for pid 17866: it was inactive for 12000s<br>
>nable to dump stack because of missing export<br>
<br>
A few are larger and contain more complaints about lengthy requests and<br>
possible timeouts:<br>
>ptlrpc_server_handle_request   Request x75091039 took longer than<br>
estimated (42+4208s); client may timeout.<br>
or<br>
>ptlrpc_server_handle_request   Dropping timed-out request from<br>
12345-140.181.114.222@tcp: deadline 1000+923s ago<br>
<br>
All of these do not seem critical?<br>
Maybe all clients have timed out for some reason?<br>
Even so, I'd assume the MDS to be still responsive, say to a mount<br>
request from a fresh client, one that does not possibly have any<br>
leftover transactions pending on it?<br>
<br>
Right now the only thing I see to do is to reboot the server. Of course<br>
not a nice procedure on a system we advertised as stable and reliable to<br>
our users...<br>
<br>
So any help will be much appreciated.<br>
Regards,<br>
Thomas<br>
<br>
<br>
_______________________________________________<br>
Lustre-discuss mailing list<br>
<a href="mailto:Lustre-discuss@lists.lustre.org">Lustre-discuss@lists.lustre.org</a><br>
<a href="http://lists.lustre.org/mailman/listinfo/lustre-discuss" target="_blank">http://lists.lustre.org/mailman/listinfo/lustre-discuss</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>(\__/)<br>( O.o)<br>( > <) Este es conejo.<br>Copia a conejo en tu firma y ayudalo en sus planes de dominación mundial.<br><br>