Hi Andrus,<div><br></div><div>Lustre does not fully support failover. It only allows to configure OST so it can be accessed on more then one OSS. However handling a failure and operation of mounting device on the failover OSS is not automatically  done by Lustre. You can not mount OST on both OSS servers simultaneously that would cause a corruption of the ldiskfs filesystem. Fortunately since some time ldiskfs comes with mmp (multi mount protection) flag which will stop you doing that (and this is probably what you are seeing in the logs). As Jeff says to fully automatically configure failover in lustre you will need to use additional HA software like  Heartbeat with Pacemaker or Corosync with Pacemaker. There are others as well but these two are most popular I think. </div>
<div><br></div><div>Best regards,</div><div><br></div><div>Wojciech<br><br><div class="gmail_quote">On 11 October 2012 22:02, Andrus, Brian Contractor <span dir="ltr"><<a href="mailto:bdandrus@nps.edu" target="_blank">bdandrus@nps.edu</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">All,<br>
<br>
I am starting to try and configure failover for our lustre filesystem.<br>
Node00 is the mgs/mdt<br>
Node00 is the oss for ost0 and failnode for ost1<br>
Node01 is the oss for ost1 and failnode for ost0<br>
<br>
Both osts are on an SRP network and are visible by both nodes.<br>
Ost0 is mounted on node00<br>
Ost1 is mounted on node01<br>
<br>
If I try to mount ost0 on node01 I see in the logs for node00:<br>
        kernel: Lustre: Denying initial registration attempt from nid 10.100.255.250@o2ib, specified as failover<br>
<br>
So do I have to manually mount the ost for failover purposes when there is a fail?<br>
I would have thought I mount the osts on both nodes and lustre will manage which node is the active node.<br>
<br>
<br>
Brian Andrus<br>
_______________________________________________<br>
Lustre-discuss mailing list<br>
<a href="mailto:Lustre-discuss@lists.lustre.org">Lustre-discuss@lists.lustre.org</a><br>
<a href="http://lists.lustre.org/mailman/listinfo/lustre-discuss" target="_blank">http://lists.lustre.org/mailman/listinfo/lustre-discuss</a><br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br>Wojciech Turek<br><br>Senior System Architect<br><br>High Performance Computing Service<br>University of Cambridge<br><br>
</div>