<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif;">
<div>For #2, I'd think having multiple MDTs would be the way to go.  In normal operation you have active-active MDSes.  If you're buying all the hardware anyway, there's no reason not to set it up to all be running under normal circumstances.</div>
<div><br>
</div>
<div>-Ben Evans</div>
<div><br>
</div>
<span id="OLK_SRC_BODY_SECTION">
<div style="font-family:Calibri; font-size:11pt; text-align:left; color:black; BORDER-BOTTOM: medium none; BORDER-LEFT: medium none; PADDING-BOTTOM: 0in; PADDING-LEFT: 0in; PADDING-RIGHT: 0in; BORDER-TOP: #b5c4df 1pt solid; BORDER-RIGHT: medium none; PADDING-TOP: 3pt">
<span style="font-weight:bold">From: </span>lustre-discuss <<a href="mailto:lustre-discuss-bounces@lists.lustre.org">lustre-discuss-bounces@lists.lustre.org</a>> on behalf of "E.S. Rosenberg" <<a href="mailto:esr+lustre@mail.hebrew.edu">esr+lustre@mail.hebrew.edu</a>><br>
<span style="font-weight:bold">Date: </span>Wednesday, December 20, 2017 at 11:21 AM<br>
<span style="font-weight:bold">To: </span>"<a href="mailto:lustre-discuss@lists.lustre.org">lustre-discuss@lists.lustre.org</a>" <<a href="mailto:lustre-discuss@lists.lustre.org">lustre-discuss@lists.lustre.org</a>><br>
<span style="font-weight:bold">Subject: </span>[lustre-discuss] Designing a new Lustre system<br>
</div>
<div><br>
</div>
<div>
<div>
<div dir="ltr">
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>Hi everyone,<br>
</div>
<br>
</div>
We are currently looking into upgrading/replacing our Lustre system with a newer system.<br>
<br>
</div>
I had several ideas I'd like to run by you and also some questions:<br>
</div>
1. After my recent experience with failover I wondered is there any reason not to set all machines that are within reasonable cable range as potential failover nodes so that in the very unlikely event of both machines connected to a disk enclosure failing simple
 recabling + manual mount would still work?<br>
<br>
</div>
2. I'm trying to decide how to do metadata, on the one hand I would very much like/prefer to have a failover pair, on the other hand when I look at the load on the MDS it seems like a big waste to have even one machine allocated to this exclusively, so I was
 thinking instead to maybe make all Lustre nodes MDS+OSS, this would as I understand potentially provide better metadata performance if needed and also allow me to put small files on the MDS and also provide for better resilience. Am I correct in these assumptions?
 Has anyone done something similar?<br>
<br>
</div>
<div>3. An LLNL lecture at Open-ZFS last year seems to strongly suggest using zfs over ldiskfs,is this indeed 'the way to go for new systems' or are both still fully valid options?<br>
<br>
4. One of my colleagues likes Isilon very much, I have not been able to find any literature on if/how Lustre compares any pointers/knowledge on the subject is very welcome.<br>
</div>
<br>
Our current system consists of 1 MDS + 3 OSS (15 OST), using FDR IB about approx 500TB in size currently running Lustre 2.8 but I hope to upgrade it to 2.10.x, the cluster it services consists of 72 nodes though we hope that will grow more.<br>
</div>
<div>A new system would hopefully (budget dependent) be at least 1PB and still be servicing the same/expanded cluster.<br>
</div>
<div><br>
</div>
Thanks,<br>
</div>
Eli<br>
</div>
</div>
</div>
</div>
</span>
</body>
</html>