<html><head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  </head>
  <body>
    <p>JC,</p>
    <p>The message where it asks if the MGS is running is a pretty
      common error that you'll see when something isn't right. There's
      not a lot of detail in your message but first step is to make sure
      your OST device is present on the OSS server. You mentioned
      remounting the RAID directories; is this software/MD RAID? Are you
      using ldiskfs or ZFS for the backend storage (I'll guess ldiskfs
      if using MD RAID). <br>
    </p>
    <p>If you've already verified the OST volume is present, see if you
      can 'lctl ping' between the MDS and OSS nodes. I'm not sure what
      your knowledge base is so forgive me if this is too elementary,
      but on each node, type 'lctl list_nids' to get the Lustre node
      identifier, then run 'lctl ping <NID>' to make sure you can
      talk Lustre/LNet between them:</p>
    <pre>[root@tin1:~]# lctl list_nids
192.168.101.1@o2ib1

[root@tin6:~]# lctl list_nids
192.168.101.6@o2ib1

[root@tin6:~]# lctl ping 192.168.101.1@o2ib1
12345-0@lo
12345-192.168.101.1@o2ib1

[root@tin1:~]# lctl ping 192.168.101.6@o2ib1
12345-0@lo
12345-192.168.101.6@o2ib1
</pre>
    <p>If you get a failure (like I/O Error), then you have a
      communications problem and you'll want to make sure all the
      correct interfaces are up. If the pings do work, then you'll want
      to look for messages in /var/log/lustre and dmesg.</p>
    <p>Cameron<br>
    </p>
    <div class="moz-cite-prefix">On 8/9/22 06:45, Crowder, Jonathan via
      lustre-discuss wrote:<br>
    </div>
    <blockquote type="cite" cite="mid:DM5P118MB01858D3FE4C9B7AD828CB280E8629@DM5P118MB0185.NAMP118.PROD.OUTLOOK.COM">
      <meta name="Generator" content="Microsoft Word 15 (filtered
        medium)">
      <style>@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;}div.WordSection1
        {page:WordSection1;}</style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
      <div class="WordSection1">
        <p class="MsoNormal">Hello, this is my first post here so I may
          need some guidance on the function of this system.<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">I am in a small team supporting some 36TB
          lustre servers for a business unit. Our configuration per
          mount point is one lustre master node and 3 lustre object
          stores. We had one of the object stores lost to an
          unidentified reboot and upon getting it booted back into the
          lustre kernel by azure cloud teams, we saw behavior where we
          could not get it to remount the raid directories for storage
          to the local file paths we have set up for them. I can obtain
          the output soon here, it knows the MGS node, but asks if it's
          running. I am having difficulty investigating more deeply into
          why this is happening as the other object stores are working
          without issue.<o:p></o:p></p>
        <p class="MsoNormal"><o:p> </o:p></p>
        <p class="MsoNormal">Thanks,<o:p></o:p></p>
        <p class="MsoNormal">JC<o:p></o:p></p>
        <br>
        <p class="msipfooter1a2dc593" style="margin:0" align="Left"><span style="font-size:10.0pt;font-family:Calibri;color:#000000">Internal</span></p>
      </div>
      <br>
      <fieldset class="moz-mime-attachment-header"></fieldset>
      <pre class="moz-quote-pre" wrap="">_______________________________________________
lustre-discuss mailing list
<a class="moz-txt-link-abbreviated moz-txt-link-freetext" href="mailto:lustre-discuss@lists.lustre.org">lustre-discuss@lists.lustre.org</a>
<a class="moz-txt-link-freetext" href="https://urldefense.us/v3/__http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org__;!!G2kpM7uM-TzIFchu!l2FbiTAR6qhLwbOqf4kfzj8IRp8tfTexTXEOpPVB2ASGCAIVUTpJGN5isgF9Ugs$">https://urldefense.us/v3/__http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org__;!!G2kpM7uM-TzIFchu!l2FbiTAR6qhLwbOqf4kfzj8IRp8tfTexTXEOpPVB2ASGCAIVUTpJGN5isgF9Ugs$</a> 
</pre>
    </blockquote>
  </body>
</html>