<div dir="ltr"><div dir="ltr">WRT Subject lnet routing issue - 2.12.5 client with 2.10.3 server:<br></div><div dir="ltr"><br></div><div>I concur with ExecStart=/usr/sbin/lnetctl set discovery=0 in the /usr/lib/systemd/system/lnet.conf file.   I also add a line below the lnetctl line is to add a line to instantiate the lustre peers desired.  Example:  ExecStart=/usr/sbin/lnetctl peer add A.B.C.[R-Z]@tcp9 --non-mr   The --non-mr is "no multirail" re-enforcing the discovery=0.  This would be done on the Lustre 2.12.x  (2.12.5) box.   Newer versions of Lustre are "network greedy" (one might also say that lnet is not practicing social distancing in networks).   As a reminder, newer Lustre 2.12.x uses /etc/lnet.conf, a commented-out example is included in the Lustre 2.12.x client install.  </div><div><br></div><div>Cheers,</div><div>megan</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Dec 1, 2020 at 12:45 PM <<a href="mailto:lustre-discuss-request@lists.lustre.org">lustre-discuss-request@lists.lustre.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex">Send lustre-discuss mailing list submissions to<br>
        <a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a><br>
<br>
To subscribe or unsubscribe via the World Wide Web, visit<br>
        <a href="http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org" rel="noreferrer" target="_blank">http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org</a><br>
or, via email, send a message with subject or body 'help' to<br>
        <a href="mailto:lustre-discuss-request@lists.lustre.org" target="_blank">lustre-discuss-request@lists.lustre.org</a><br>
<br>
You can reach the person managing the list at<br>
        <a href="mailto:lustre-discuss-owner@lists.lustre.org" target="_blank">lustre-discuss-owner@lists.lustre.org</a><br>
<br>
When replying, please edit your Subject line so it is more specific<br>
than "Re: Contents of lustre-discuss digest..."<br>
<br>
<br>
Today's Topics:<br>
<br>
   1. Re: lnet routing issue - 2.12.5 client with 2.10.3 server<br>
      (Mark Lundie)<br>
<br>
<br>
----------------------------------------------------------------------<br>
<br>
Message: 1<br>
Date: Tue, 1 Dec 2020 12:58:27 +0000<br>
From: Mark Lundie <<a href="mailto:mark.lundie@manchester.ac.uk" target="_blank">mark.lundie@manchester.ac.uk</a>><br>
To: "Degremont, Aurelien" <<a href="mailto:degremoa@amazon.com" target="_blank">degremoa@amazon.com</a>>, f?rat y?lmaz<br>
        <<a href="mailto:firatyilmazz@gmail.com" target="_blank">firatyilmazz@gmail.com</a>><br>
Cc: "<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a>"<br>
        <<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a>><br>
Subject: Re: [lustre-discuss] lnet routing issue - 2.12.5 client with<br>
        2.10.3 server<br>
Message-ID:<br>
        <<a href="mailto:AM6PR0102MB3112477460E5A537EB5C06F8DEF40@AM6PR0102MB3112.eurprd01.prod.exchangelabs.com" target="_blank">AM6PR0102MB3112477460E5A537EB5C06F8DEF40@AM6PR0102MB3112.eurprd01.prod.exchangelabs.com</a>><br>
<br>
Content-Type: text/plain; charset="iso-8859-3"<br>
<br>
Hi Aur?lien,<br>
<br>
Many thanks! Sorry I missed that. I'll try disabling discovery as suggested.<br>
<br>
Thanks,<br>
<br>
Mark<br>
________________________________<br>
From: Degremont, Aurelien <<a href="mailto:degremoa@amazon.com" target="_blank">degremoa@amazon.com</a>><br>
Sent: 01 December 2020 12:42<br>
To: Mark Lundie <<a href="mailto:mark.lundie@manchester.ac.uk" target="_blank">mark.lundie@manchester.ac.uk</a>>; f?rat y?lmaz <<a href="mailto:firatyilmazz@gmail.com" target="_blank">firatyilmazz@gmail.com</a>><br>
Cc: <a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a> <<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a>><br>
Subject: Re: [lustre-discuss] lnet routing issue - 2.12.5 client with 2.10.3 server<br>
<br>
<br>
This is a known issue, see <a href="https://jira.whamcloud.com/browse/LU-11840" rel="noreferrer" target="_blank">https://jira.whamcloud.com/browse/LU-11840</a> and <a href="https://jira.whamcloud.com/browse/LU-13548" rel="noreferrer" target="_blank">https://jira.whamcloud.com/browse/LU-13548</a><br>
<br>
<br>
<br>
Aur?lien<br>
<br>
<br>
<br>
De : lustre-discuss <<a href="mailto:lustre-discuss-bounces@lists.lustre.org" target="_blank">lustre-discuss-bounces@lists.lustre.org</a>> au nom de Mark Lundie <<a href="mailto:mark.lundie@manchester.ac.uk" target="_blank">mark.lundie@manchester.ac.uk</a>><br>
Date : mardi 1 d?cembre 2020 ? 13:16<br>
? : f?rat y?lmaz <<a href="mailto:firatyilmazz@gmail.com" target="_blank">firatyilmazz@gmail.com</a>><br>
Cc : "<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a>" <<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a>><br>
Objet : RE: [EXTERNAL] [lustre-discuss] lnet routing issue - 2.12.5 client with 2.10.3 server<br>
<br>
<br>
<br>
CAUTION: This email originated from outside of the organization. Do not click links or open attachments unless you can confirm the sender and know the content is safe.<br>
<br>
<br>
<br>
Hi Firat,<br>
<br>
Thanks for your reply. Apologies if I am being silly here, but there is no route configured for that network. We have the networks tcp (<a href="http://10.110.0.0/16" rel="noreferrer" target="_blank">10.110.0.0/16</a>) and tcp1 (<a href="http://10.10.0.0/16" rel="noreferrer" target="_blank">10.10.0.0/16</a>). The servers have interfaces on both, but the clients only have an interface on tcp1. I'm not sure why the client is trying to route to 10.110.0.21@tcp:<br>
<br>
<br>
<br>
client # mount /net/lustre/<br>
<br>
mount.lustre: mount hmeta1@tcp1:hmeta2@tcp1:/lustre at /net/lustre failed: Input/output error<br>
<br>
Is the MGS running?<br>
<br>
<br>
<br>
hmeta1 resolves to 10.10.0.91, on tcp1.<br>
<br>
<br>
<br>
Thanks,<br>
<br>
<br>
<br>
Mark<br>
<br>
________________________________<br>
<br>
From: f?rat y?lmaz <<a href="mailto:firatyilmazz@gmail.com" target="_blank">firatyilmazz@gmail.com</a>><br>
Sent: 01 December 2020 11:55<br>
To: Mark Lundie <<a href="mailto:mark.lundie@manchester.ac.uk" target="_blank">mark.lundie@manchester.ac.uk</a>><br>
Cc: <a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a> <<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a>><br>
Subject: Re: [lustre-discuss] lnet routing issue - 2.12.5 client with 2.10.3 server<br>
<br>
<br>
<br>
Hi Mark,<br>
<br>
<br>
<br>
[Tue Dec  1 11:07:55 2020] LNetError: 2127:0:(lib-move.c:1999:lnet_handle_find_routed_path()) no route to 10.110.0.21@tcp from <?><br>
<br>
<br>
<br>
I would suggest checking  lnetctl routing show and remove the route to  10.110.0.21@tcp and try to mount.<br>
<br>
<a href="https://wiki.lustre.org/LNet_Router_Config_Guide" rel="noreferrer" target="_blank">https://wiki.lustre.org/LNet_Router_Config_Guide</a><br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
On Tue, Dec 1, 2020 at 2:41 PM Mark Lundie <<a href="mailto:mark.lundie@manchester.ac.uk" target="_blank">mark.lundie@manchester.ac.uk</a><mailto:<a href="mailto:mark.lundie@manchester.ac.uk" target="_blank">mark.lundie@manchester.ac.uk</a>>> wrote:<br>
<br>
Hi all,<br>
<br>
<br>
<br>
I've just run in to an issue mounting on a newly upgraded client running 2.12.5 with 2.10.3 servers. Just to give some background, we're about to replace our existing Lustre storage, but will run it concurrently with the replacement for a couple of months. We'll be running 2.12.5 server on the new MDS and OSSs and I plan to update all clients to the same version. I would like to avoid updating the existing servers though.<br>
<br>
<br>
<br>
The problem is this. The servers have two tcp LNET networks, tcp and tcp1, on separate subnets and VLANs. The clients only see tcp1 (a small number are also on tcp3, routed via 2 lnet routers), which has been fine until now. With the 2.12.5 client, however, it is trying to mount from tcp. 2.10.3 to 2.12.5 is obviously a bit of a jump, but does anyone have any ideas on what has changed and what I could do here please?<br>
<br>
<br>
<br>
meta# lnetctl net show<br>
<br>
net:<br>
<br>
    - net type: lo<br>
<br>
      local NI(s):<br>
<br>
        - nid: 0@lo<br>
<br>
          status: up<br>
<br>
    - net type: tcp<br>
<br>
      local NI(s):<br>
<br>
        - nid: 10.110.0.21@tcp<br>
<br>
          status: up<br>
<br>
          interfaces:<br>
<br>
              0: bond0.22<br>
<br>
    - net type: tcp1<br>
<br>
      local NI(s):<br>
<br>
        - nid: 10.10.0.91@tcp1<br>
<br>
          status: up<br>
<br>
          interfaces:<br>
<br>
              0: bond0<br>
<br>
<br>
<br>
meta# lnetctl route show<br>
<br>
route:<br>
<br>
    - net: tcp2<br>
<br>
      gateway: 10.10.0.254@tcp1<br>
<br>
    - net: tcp3<br>
<br>
      gateway: 10.10.0.254@tcp1<br>
<br>
<br>
<br>
client# lnetctl net show<br>
<br>
net:<br>
<br>
    - net type: lo<br>
<br>
      local NI(s):<br>
<br>
        - nid: 0@lo<br>
<br>
          status: up<br>
<br>
    - net type: o2ib<br>
<br>
      local NI(s):<br>
<br>
        - nid: 10.12.170.47@o2ib<br>
<br>
          status: up<br>
<br>
          interfaces:<br>
<br>
              0: ib0<br>
<br>
    - net type: tcp1<br>
<br>
      local NI(s):<br>
<br>
        - nid: 10.10.170.47@tcp1<br>
<br>
          status: up<br>
<br>
          interfaces:<br>
<br>
              0: em1<br>
<br>
<br>
<br>
[Tue Dec  1 11:07:55 2020] LNetError: 2127:0:(lib-move.c:1999:lnet_handle_find_routed_path()) no route to 10.110.0.21@tcp from <?><br>
<br>
[Tue Dec  1 11:08:01 2020] LustreError: 1792:0:(mgc_request.c:249:do_config_log_add()) MGC10.10.0.91@tcp1: failed processing log, type 1: rc = -5<br>
<br>
[Tue Dec  1 11:08:08 2020] LustreError: 2169:0:(mgc_request.c:599:do_requeue()) failed processing log: -5<br>
<br>
[Tue Dec  1 11:08:19 2020] LNetError: 2127:0:(lib-move.c:1999:lnet_handle_find_routed_path()) no route to 10.110.0.22@tcp from <?><br>
<br>
[Tue Dec  1 11:08:30 2020] LustreError: 15c-8: MGC10.10.0.91@tcp1: The configuration from log 'lustre-client' failed (-5). This may be the result of communication errors between this node and the MGS, a bad configuration, or other errors. See the syslog for more information.<br>
<br>
<br>
<br>
client# lctl ping 10.10.0.91@tcp1<br>
<br>
12345-0@lo<br>
<br>
12345-10.110.0.21@tcp<br>
<br>
12345-10.10.0.91@tcp1<br>
<br>
<br>
<br>
Any suggestions will be greatly appreciated!<br>
<br>
<br>
<br>
Many thanks,<br>
<br>
<br>
<br>
Mark<br>
<br>
<br>
<br>
Dr Mark Lundie | Research IT Systems Administrator | Research IT | Directorate of IT Services | B39, Sackville Street Building | The University of Manchester | Manchester | M1 3WE | 0161 275 8403 | <a href="http://ri.itservices.manchester.ac.uk" rel="noreferrer" target="_blank">ri.itservices.manchester.ac.uk</a><br>
<br>
<br>
<br>
Working Hours: Tues - Thurs 0730-1730; Fri 0730-1630<br>
<br>
_______________________________________________<br>
lustre-discuss mailing list<br>
<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a><mailto:<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a>><br>
<a href="http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org" rel="noreferrer" target="_blank">http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org</a><br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://lists.lustre.org/pipermail/lustre-discuss-lustre.org/attachments/20201201/67c784f2/attachment.html" rel="noreferrer" target="_blank">http://lists.lustre.org/pipermail/lustre-discuss-lustre.org/attachments/20201201/67c784f2/attachment.html</a>><br>
<br>
------------------------------<br>
<br>
Subject: Digest Footer<br>
<br>
_______________________________________________<br>
lustre-discuss mailing list<br>
<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a><br>
<a href="http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org" rel="noreferrer" target="_blank">http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org</a><br>
<br>
<br>
------------------------------<br>
<br>
End of lustre-discuss Digest, Vol 177, Issue 4<br>
**********************************************<br>
</blockquote></div>