<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
  <head>
    <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
  </head>
  <body bgcolor="#ffffff" text="#000000">
    Hi,<br>
    <br>
      If you refer to my previous message, you will see that I have two
    multihomed clusters, each having Lustre servers and  clients.  I
    have clients mounting lustre partitions from o2ib and tcp.  Now I am
    inplementing failover, did a try this morning without success, so
    RTFM.  I read:<br>
    <br>
    Note – If you have an MGS or MDT configured for failover, perform
    these steps:<br>
    1. On the OST, list the NIDs of all MGS nodes at mkfs time.<br>
    OST# mkfs.lustre --fsname sunfs --ost --mgsnode=10.0.0.1<br>
    --mgsnode=10.0.0.2 /dev/{device}<br>
    2. On the client, mount the file system.<br>
    client# mount -t lustre 10.0.0.1:10.0.0.2:/sunfs /cfs/client/<br>
    <br>
    So I extended the logic from :<br>
    <big><br>
      <tt><font size="2"><big><span style="font-weight: normal;">mkfs.lustre
--mgs
              --mdt --fsname=sata <a
                href="mailto:--failnode%3Dib4-st02s@o2ib4">--failnode=ib3-st02s@o2ib3</a>
              --reformat /dev/mpath/emcssd-1</span></big></font><br>
      </tt><font size="2"><big><span style="font-weight: normal;"><tt>mkfs.lustre
--fsname
              sata --reformat --ost --mgsnode=ib3-st01s@o2ib3
              --mgsnode=ib3-st01e@tcp <a
                href="mailto:--failnode%3Dib4-st02s@o2ib4">--failnode=ib3-st02s@o2ib3</a></tt>
            /dev/mpath/colosse4-lun54-sata</span></big></font><font
        face="Liberation Mono, monospace"><font size="2"><big><span
              style="font-weight: normal;"></span></big></font></font></big>
    <style type="text/css">p { margin-bottom: 0.08in; }a:link {  }</style>
    <p style="margin-bottom: 0in;">to:<br>
    </p>
    <tt> mkfs.lustre --mgs --mdt --fsname=sata
      --failnode=ib3-st02s@o2ib3,ib3-st02e@tcp --reformat
      /dev/mpath/emcssd-1<br>
    </tt><tt>mkfs.lustre --fsname sata --reformat --ost
      --mgsnode=ib3-st01s@o2ib3,ib3-st01e@tcp
      --mgsnode=ib3-st02s@o2ib3,ib3-st02e@tcp
      --failnode=ib3-st02s@o2ib3,ib3-st02e@tcp 
      /dev/mpath/colosse4-lun53-sata</tt>
    <br>
    <br>
    And so on for other  disks.<br>
    <br>
    Partitions mounts great on the MDS/MGS/OSS server, but on the OSS
    only, I have:<br>
    <br>
    [root@ib3-st03 ~]# mount -t lustre /dev/mpath/colosse4-lun55-sata
    /mnt/data/clun55<br>
    mount.lustre: mount /dev/mpath/colosse4-lun55-sata at
    /mnt/data/clun55 failed: Interrupted system call<br>
    <br>
    messages file contains:<br>
    <br>
    Dec 21 15:18:52 ib3-st03 kernel: Lustre:
    9464:0:(client.c:1487:ptlrpc_expire_one_request()) @@@ Request
    x1388814699331655 sent from MGC10.10.135.115@o2ib3 to NID
    10.10.135.116@o2ib3 5s ago has timed out (5s prior to deadline).<br>
    Dec 21 15:18:52 ib3-st03 kernel:   req@ffff810116fff800
    x1388814699331655/t0 o250-><a class="moz-txt-link-abbreviated" href="mailto:MGS@MGC10.10.135.115@o2ib3_1:26/25">MGS@MGC10.10.135.115@o2ib3_1:26/25</a>
    lens 368/584 e 0 to 1 dl 1324480732 ref 1 fl Rpc:N/0/0 rc 0/0<br>
    Dec 21 15:18:52 ib3-st03 kernel: LustreError:
    23519:0:(obd_mount.c:1112:server_start_targets()) Required
    registration failed for sata-OSTffff: -4<br>
    Dec 21 15:18:52 ib3-st03 kernel: LustreError:
    23519:0:(obd_mount.c:1670:server_fill_super()) Unable to start
    targets: -4<br>
    Dec 21 15:18:52 ib3-st03 kernel: LustreError:
    23519:0:(obd_mount.c:1453:server_put_super()) no obd sata-OSTffff<br>
    Dec 21 15:18:52 ib3-st03 kernel: LustreError:
    23519:0:(obd_mount.c:147:server_deregister_mount()) sata-OSTffff not
    registered<br>
    Dec 21 15:18:52 ib3-st03 kernel: Lustre: server umount sata-OSTffff
    complete<br>
    Dec 21 15:18:52 ib3-st03 kernel: LustreError:
    23519:0:(obd_mount.c:2065:lustre_fill_super()) Unable to mount  (-4)<br>
    <br>
    <br>
    so my question is?<br>
    <br>
    What would ne the correct syntax to make sure I have a failover on
    the o2ib clients as well as the tcp clients?<br>
    <br>
    Thanks<br>
    <br>
    <pre class="moz-signature" cols="72">  
</pre>
    <br>
    <pre class="moz-signature" cols="72">-- 
Patrice Hamelin
Specialiste sénior en systèmes d'exploitation | Senior OS specialist
Environnement Canada | Environment Canada
2121, route Transcanadienne | 2121 Transcanada Highway
Dorval, QC H9P 1J3
Téléphone | Telephone 514-421-5303
Télécopieur | Facsimile 514-421-7231
Gouvernement du Canada | Government of Canada</pre>
  </body>
</html>