Hi Brendon,<br><br>Can you please provide following:<br>1) output of ifconfig run on each OSS MDS and at least one client<br>2) output of lctl list_nids run on each OSS MDS and at least one client<br>3) output of tunefs.lustre --print --dryrun /dev/<OST_block_device> from each OSS<br>
<br>Wojciech<br><br><div class="gmail_quote">On 11 January 2011 23:07, Brendon <span dir="ltr"><<a href="mailto:b@brendon.com">b@brendon.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
I continued mounting the OSTs on n1 and n2. I received the same errors<br>
when mounting them as on n0.<br>
<br>
I then tried mounting the lustre as a client. That worked, but<br>
touching a file on it caused it to hang and spit the errors below on<br>
server head. After about a minute the server became unresponsive to<br>
ping. I'm guessing it has oops'ed.<br>
<br>
I googled the ost_connect error -16, but haven't found anything<br>
relevnat yet that appears useful.<br>
I'm going to take a break. I've been working this one all day... time<br>
for a late lunch.<br>
<br>
Any insight is much appreciated.<br>
-Brendon<br>
<br>
Jan 11 14:54:19 jupiter kernel: LustreError: 11-0: an error occurred<br>
while communicating with 10.1.1.3@tcp. The ost_connect operation<br>
failed with -16<br>
Jan 11 14:54:19 jupiter kernel: LustreError: Skipped 5 previous similar messages<br>
Jan 11 14:57:14 jupiter kernel: LustreError:<br>
7694:0:(osc_create.c:348:osc_create()) mylustre-OST0002-osc: oscc<br>
recovery failed: -110<br>
Jan 11 14:57:14 jupiter kernel: LustreError:<br>
7693:0:(osc_create.c:348:osc_create()) mylustre-OST0001-osc: oscc<br>
recovery failed: -110<br>
Jan 11 14:57:14 jupiter kernel: LustreError:<br>
7694:0:(lov_obd.c:1074:lov_clear_orphans()) error in orphan recovery<br>
on OST idx 2/4: rc = -110<br>
Jan 11 14:57:14 jupiter kernel: LustreError: 11-0: an error occurred<br>
while communicating with 10.1.1.4@tcp. The ost_connect operation<br>
failed with -16<br>
Jan 11 14:57:14 jupiter kernel: LustreError: Skipped 9 previous similar messages<br>
<div><div></div><div class="h5">_______________________________________________<br>
Lustre-discuss mailing list<br>
<a href="mailto:Lustre-discuss@lists.lustre.org">Lustre-discuss@lists.lustre.org</a><br>
<a href="http://lists.lustre.org/mailman/listinfo/lustre-discuss" target="_blank">http://lists.lustre.org/mailman/listinfo/lustre-discuss</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Wojciech Turek<br><br>Senior System Architect<br><br>High Performance Computing Service<br>University of Cambridge<br><br>