<div dir="auto">Sounds like an issue with the client. Have you captured console output to determine what's failing?</div><div class="gmail_extra"><br><div class="gmail_quote">On Jun 8, 2017 8:49 AM, "Langton" <<a href="mailto:langtonn@eclipseholdings.co.za">langtonn@eclipseholdings.co.za</a>> wrote:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">I am trying to install Robin Hood to manage a 4PB lustre filesystem.<br>
The environment is as follows<br>
IEEL Lustre 2.5<br>
Robinhood 2.5.5-2<br>
CentOS release 6.7<br>
kernel - 2.6.32-573.8.1.el6.x86_64<br>
4PB Lustre Filesystem<br>
Robin Hood Host has 2TB RAM and 390GB Disk capacity<br>
FDR Infiniband fabric network<br>
A Failover setup on all lustre servers<br>
<br>
 After installing robinhood , I have faced a challenge when I kickstart a scan. For some reason the RBH host reboots just a few seconds after issuing the scan command. I have traced the robinhood logs but they give the following:<br>
<br>
2017/06/08 16:19:38 [15616/21] FS_Scan | openat failed on 23/pci-0000:00:1a.0-usb-0:1.6.<wbr>1:1.2-event-mouse: Too many levels of symbolic links<br>
2017/06/08 16:19:38 [15616/21] FS_Scan | openat failed on 23/platform-pcspkr-event-spkr: Too many levels of symbolic links<br>
2017/06/08 16:19:38 [15616/21] FS_Scan | openat failed on 23/pci-0000:00:1a.0-usb-0:1.6.<wbr>1:1.2-mouse: Too many levels of symbolic links<br>
2017/06/08 16:19:38 [15616/21] FS_Scan | openat failed on 23/pci-0000:00:1a.0-usb-0:1.2:<wbr>1.0-event-mouse: Too many levels of symbolic links<br>
2017/06/08 16:19:38 [15616/21] FS_Scan | openat failed on 23/pci-0000:00:1a.0-usb-0:1.6.<wbr>1:1.1-mouse: Too many levels of symbolic links<br>
2017/06/08 16:19:38 [15616/21] FS_Scan | openat failed on 23/pci-0000:00:1a.0-usb-0:1.5.<wbr>1:1.1-event: Too many levels of symbolic links<br>
<br>
As a test i started the robinhood-lhsm service and it started fine without the initial scan.<br>
The command - rbh-lhsm-report --fs-info gives you some info but not much detailed.<br>
The command - rbh-lhsm-report -a says file storage has never been checked which means a scan is needed.<br>
Currently the filesystem is in production. Can this the main reason why it crashes.<br>
The filesystem is sitting at 2.6PB of used capacity.<br>
<br>
Regards<br>
<br>
Langton<br>
______________________________<wbr>_________________<br>
lustre-discuss mailing list<br>
<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.or<wbr>g</a><br>
<a href="http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org" rel="noreferrer" target="_blank">http://lists.lustre.org/listin<wbr>fo.cgi/lustre-discuss-lustre.<wbr>org</a><br>
</blockquote></div></div>