How would the OSS's and client's communicate with the MDS server in a failover situation?<br><br>This is how I am doing things:<br><br>mds01: mkfs.lustre --fsname=fsname --mdt --mgs /dev/vgname/lvname<br><br>oss01: mkfs.lustre --ost --fsname=fsname --failnode=oss02@o2ib3 --mgsnode=mds01@o2ib3 /dev/mapper/mpath0<br>
oss02: mkfs.lustre --ost --fsname=fsname --failnode=oss01@o2ib3 --mgsnode=mds01@o2ib3 /dev/mapper/mpath0<br><br>client01: mount -t lustre mds01-ib@o2ib3:/fsname /mnt<br><br>Now, if mds01 fails over to mds02, how would the client communicate with the new MDS server if the IP changes?<br>
<br>What would the mkfs.lustre commands look like for a HA setup for MDS & OSS.  <br><br>Also, is there a downfall for using a virtual IP for the MDS's?  <br><br>Thanks in advance for your assistance.<br>-J<br><br>
<br><br><div class="gmail_quote">On Tue, Jan 19, 2010 at 2:43 AM, Andreas Dilger <span dir="ltr"><<a href="mailto:adilger@sun.com">adilger@sun.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="im">On 2010-01-19, at 13:01, Jagga Soorma wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
I am working on clustering our MDS & OSS servers and wanted to make sure I understand this correctly.  Can you please let me know if this sounds right:<br>
<br>
a) Planning on having a floating virtual IP setup on the active MDS server (ib1:1).  This is what the OSS's will use when doing their mkfs.  In an outage this virtual IP address will migrate to the standby node.<br>
</blockquote>
<br></div>
This is not how Lustre failover works.  You need to assign a separate IP address for each MDS server.  Lustre handles multiple MDS failover nodes itself.<div class="im"><br>
<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
b) On the oss's there is no need for a virtual IP that would need to fail over in an outage.  I would simply have heartbeat mount the filesystems on the other OSS node.<br>
</blockquote>
<br>
<br></div>
Cheers, Andreas<br><font color="#888888">
--<br>
Andreas Dilger<br>
Sr. Staff Engineer, Lustre Group<br>
Sun Microsystems of Canada, Inc.<br>
<br>
</font></blockquote></div><br>