<p>Hi Thomas, nice to see you have remained active in the Lustre community.  To your question, I don't have an answer, but it seems like the timeout may be masking the root issue - perhaps a system or network issue - I always start with hostname resolution.  :)</p>
<div class="gmail_quote">On Oct 24, 2017 11:08 AM, "Thomas Roth" <<a href="mailto:t.roth@gsi.de">t.roth@gsi.de</a>> wrote:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Sorry to have bothered you - works now.<br>
<br>
I have set /sys/fs/lustre/timeout=3000, quite brutally, to make things go verrry slowly, and after 25 minutes the mount was there.<br>
<br>
Which control aka timeout-parameter _should_ I have tuned instead in such a situation?<br>
<br>
Regards,<br>
Thomas<br>
<br>
On 10/24/2017 06:26 PM, Thomas Roth wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi all,<br>
<br>
in a Lustre 2.10, CentOS 7.4 test system, I have a pair of MDS, format command was<br>
<br>
 > mkfs.lustre --mgs --mdt --fsname=test --index=0<br>
--servicenode=10.20.1.198@o2ib<wbr>5 --servicenode=10.20.1.199@o2ib<wbr>5<br>
     --mgsnode=10.20.1.198@o2ib5   <wbr>  --mgsnode=10.20.1.199@o2ib5  /dev/drbd0<br>
<br>
I added some OSS and clients, everything working.<br>
<br>
Then I switched off 10.20.1.198 and mounted my MGS/MDT on 10.20.1.199.<br>
All OSS and clients connected, everything working.<br>
<br>
Now I try to add a client that was never there before,<br>
 > mount -t lustre 10.20.1.198@o2ib5:10.20.1.199@<wbr>o2ib5:/test  /lustre/test<br>
<br>
But this client only tries to connect to 10.20.1.198@o2ib5 - and fails.<br>
The log says<br>
<br>
LNet: 47655:0:(o2iblnd_cb.c:2672:kib<wbr>lnd_check_reconnect()) 10.20.1.198@o2ib5: reconnect (invalid service id), 12, 12, msg_size: 4096, queue_depth: 8/-1, max_frags: 256/-1<br>
LNet: 47655:0:(o2iblnd_cb.c:2698:kib<wbr>lnd_rejected()) 10.20.1.198@o2ib5 rejected: no listener at 987<br>
...<br>
LustreError: 48560:0:(mgc_request.c:251:do_<wbr>config_log_add()) MGC10.20.1.198@o2ib5: failed processing log, type 1: rc = -5<br>
LNet: 48427:0:(o2iblnd_cb.c:3207:kib<wbr>lnd_check_conns()) Timed out tx for 10.20.1.198@o2ib5: 4301501 seconds<br>
Lustre: 48441:0:(client.c:2114:ptlrpc_<wbr>expire_one_request()) @@@ Request sent has failed due to network error: [sent 1508861258/real 1508861264]  req@ffff88103dc78000 x1582155623825424/t0(0) o250->MGC10.20.1.198@o2ib5@10.<wbr>20.1.198@o2ib5:26/25 lens 520/544 e 0 to 1 dl 1508861408 ref 1 fl Rpc:eXN/0/ffffffff rc 0/-1<br>
<br>
<br>
all of which seems logical but not wanted - where is my 10.20.1.199@o2ib5 ?<br>
<br>
Of course I can 'lctl ping 10.20.1.199@o2ib5'.<br>
And I have since umounted on one of the older clients, unloaded the Lustre modules, and mounted again - works.<br>
<br>
<br>
Regards,<br>
Thomas<br>
<br>
</blockquote>
<br>
-- <br>
------------------------------<wbr>------------------------------<wbr>--------<br>
Thomas Roth<br>
Department: Informationstechnologie<br>
Location: SB3 1.250<br>
Phone: <a href="tel:%2B49-6159-71%201453" value="+496159711453" target="_blank">+49-6159-71 1453</a>  Fax: <a href="tel:%2B49-6159-71%202986" value="+496159712986" target="_blank">+49-6159-71 2986</a><br>
<br>
GSI Helmholtzzentrum für Schwerionenforschung GmbH<br>
Planckstraße 1<br>
64291 Darmstadt<br>
<a href="http://www.gsi.de" rel="noreferrer" target="_blank">www.gsi.de</a><br>
<br>
Gesellschaft mit beschränkter Haftung<br>
Sitz der Gesellschaft: Darmstadt<br>
Handelsregister: Amtsgericht Darmstadt, HRB 1528<br>
<br>
Geschäftsführung: Ursula Weyrich<br>
Professor Dr. Paolo Giubellino<br>
Jörg Blaurock<br>
<br>
Vorsitzende des Aufsichtsrates: St Dr. Georg Schütte<br>
Stellvertreter: Ministerialdirigent Dr. Rolf Bernhardt<br>
<br>
______________________________<wbr>_________________<br>
lustre-discuss mailing list<br>
<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.or<wbr>g</a><br>
<a href="http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org" rel="noreferrer" target="_blank">http://lists.lustre.org/listin<wbr>fo.cgi/lustre-discuss-lustre.<wbr>org</a><br>
</blockquote></div>