<div><div dir="auto">Greetings Megan,</div><div dir="auto"><br></div><div dir="auto">One scenario that could cause this is if your appliance-style Lustre MDS is a high-availability server pair and your mount command is not declaring both NIDs in the mount command *and* the MGS and MDT resources happen to be presently residing on the MDS server you are not declaring in your mount command.</div><div dir="auto"><br></div><div dir="auto">If it is high-availability and the IPs of those servers is A.B.C.D and A.B.C.E then make sure your command command looks something like:</div><div dir="auto"><br></div><div dir="auto">mount -t lustre A.B.C.D@tcp:A.B.C.E@tcp:/somefsname /localmountpoint </div><div dir="auto"><br></div><div dir="auto">That way the client will be looking for the MGS in all of the places it *could* be located.</div><div dir="auto"><br></div><div dir="auto">Just one possibility of what may be the cause. Certainly easier and less painful than a lower level version compatibility issue.</div><div dir="auto"><br></div><div dir="auto">—Jeff</div><br><div class="gmail_quote"><div>On Wed, Feb 28, 2018 at 13:36 Ms. Megan Larko <<a href="mailto:dobsonunit@gmail.com">dobsonunit@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div><div><div><div><div><div><div><div><div><div><div><div><div><div>Greetings List!<br><br></div>We have been continuing to dissect our LNet environment between our lustre-2.7.0 clients and the lustre-2.7.18 servers.  We have moved from the client node to the LNet server which bridges the InfiniBand (IB) and ethernet networks.   As a test, we attempted to mount the ethernet Lustre storage from the LNet hopefully taking the IB out of the equation to limit the scope of our debugging.<br><br></div>On the LNet router the attempted mount of Lustre storage fails.   The LNet command line error on the test LNet client is exactly the same as the original client result:<br></div>mount A.B.C.D@tcp0:/lustre at /mnt/lustre failed: Input/output error  Is the MGS running?<br><br></div>On the lustre servers, both the MGS/MDS and OSS we can see the error via dmesg:<br></div>LNet: There was an unexpected network error while writing to C.D.E.F:  -110<br><br></div>and we see the periodic (~ every 10 to 20 minutes) in dmesg on MGS/MDS:<br></div>Lustre: MGS: Client <id string> (at C.D.E.F@tcp) reconnecting<br><br></div>The "lctl pings" in various directions are still successful.<br><br></div>So, forget the end lustre client, we are not yet getting from MGS/MDS sucessfully to the LNet router.<br></div>We have been looking at the contents of /sys/module/lustre.conf and we are not seeing any differences in set values between the LNet router we are using as a test Lustre client and the Lustre MGS/MDS server.<br><br></div>As much as I'd _love_ to go to Lustre-2.10.x, we are dealing with both "appliance" style Lustre storage systems and clients tied to specific versions of the linux kernel (for reasons other than Lustre).<br><br></div>Is there a key parameter which I could still be overlooking?<br><br></div>Cheers,<br></div>megan<br></div>
_______________________________________________<br>
lustre-discuss mailing list<br>
<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a><br>
<a href="http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org" rel="noreferrer" target="_blank">http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org</a><br>
</blockquote></div></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr">------------------------------<br>Jeff Johnson<br>Co-Founder<br>Aeon Computing<br><br><a href="mailto:jeff.johnson@aeoncomputing.com" target="_blank">jeff.johnson@aeoncomputing.com</a><br><a href="http://www.aeoncomputing.com" target="_blank">www.aeoncomputing.com</a><br>t: 858-412-3810 x1001   f: 858-412-3845<br>m: 619-204-9061<br><br>4170 Morena Boulevard, Suite D - San Diego, CA 92117<div><br></div><div>High-Performance Computing / Lustre Filesystems / Scale-out Storage</div></div></div>