Okay - that's what I feared; glad to have it confirmed.<br><br>Thanks Kevin, appreciate the quick response. :)<br><br>-- <br>--------------------------------------------------------------------------------------------------<br>
Gary Gogick<br>senior systems administrator  |  workhabit,inc.<br><br><br><div class="gmail_quote">On Fri, Jun 19, 2009 at 2:15 PM, Kevin Van Maren <span dir="ltr"><<a href="mailto:Kevin.Vanmaren@sun.com">Kevin.Vanmaren@sun.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="im">Gary Gogick wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Heya all,<br>
<br>
I'm investigating potential solutions for a storage deployment.  Lustre piqued my interest due to ease of scalability and awesome aggregate throughput potential. <br>
Wondering if there's any provision in Lustre for handling catastrophic loss of a node containing an OST; eg. replication/mirroring of OSTs to other nodes?<br>
<br>
I'm gathering from the 1.8.0 documentation that there's no protection of this sort for data other than underlying RAID configs on any individual node, at least not without attempting to do some interesting stuff with DRDB.  Just started looking at Lustre over the past day though, so I'd totally appreciate an authoritative answer in case I'm misinterpreting the documentation. :)<br>

</blockquote>
<br></div>
Correct.<br>
<br>
Lustre failover can be used to support catastrophic failure of a _node_, but not the _storage_.  If your configuration makes LUNs available to two nodes, it is possible to configure Lustre to operate across the failure of a server.<br>

<br>
If your LUN fails catastrophically, all the data on that lun is gone.  It is possible to bring Lustre up without it, but none of the files on that OST would be available.  If you are concerned about this case, then backups are your friend.<br>

<br>
While drdb could be used to make a lun "available" to two nodes, it will have a significant impact on performance, and (AFAIK) does not do synchronous replication, so an fsck would be required prior to mounting the OST on the second node, and there would be some data loss.<br>
<font color="#888888">
<br>
Kevin<br>
<br>
</font></blockquote></div><br><br>