<div dir="ltr"><div><div>Hi ...,<br><br></div><div>Currently, Failover and Recovery takes a very long long time in our setup; almost 20 Minutes. We would like to make it as fast as possible.<br></div><div><br></div><div>I have two queries regarding this -<br></div><div><br>1.<br>===================================================<br></div><div>The MGS and MDT are on the same host.<br></div><div><br></div><div>We do however have a passive stand-by server for the MGS/MDT server, which only mounts these partitions in case of a failure.<br><br></div><div><u>Current Setup</u><br></div><div>Server A: MGS+MDT<br></div><div>Server B: Failover MGS+MDT<br></div><div><br></div><div>I was wondering whether I can now move the MGS or MDT Partition to the standby server (so that imperative recovery works properly) - <br><br></div><div><u>New Setup</u><br></div><div>Server A: MDT & <b>Failover MGS</b><br></div><div>Server B: <b>MGS</b> & Failover MDT<br></div><div></div><div>   <b>OR<br></b><div>Server A: <b>MGS</b> & Failover MDT<br></div>Server B: MDT & <b>Failover MGS</b><br><br></div><div>i.e. <br><b>Can I separate the MDT and MGS partitions on to different machines without formatting or reinstalling Lustre?<br></b></div><div>===================================================<br><br>2.<br>===================================================<br></div><div>This storage is used by around 150 Workstations and 150 Compute (Render) Nodes.<br><br></div><div>Out of these 150 workstations, around 30 - 40 are MS Windows. The MS Windows clients access the storage through a 2-node Samba Gateway Cluster.<br><br></div><div>The Gateway Nodes are connected to the storage through a QDR Infiniband Network.<br><br></div><div>We were thinking of adding NFS Service to the Samba Gateway nodes, and reconfiguring the Linux clients to connect via this gateway. <br><br></div>This will bring down the direct Lustre Clients to just 2 nodes.<br></div><div><div><b>So, will having only 2 clients improve the failover-recovery time?</b><br></div><div>===================================================<br><br></div><div>Is there anything else we can do to speed up recovery?<br></div><div><br></div>Regards,<br><br><br></div>Indivar Nair<br></div>