<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.5.7654.12">
<TITLE>LustreError: 11-0: an error occurred while communicating with 192.168.16.24@o2ib. The ost_connect operation failed with -19</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/plain format -->

<P><FONT SIZE=2>Hi,<BR>
<BR>
I have encountered an issue with Lustre that has happened a couple of times<BR>
now.  I am beginning to suspect an issue with the IB fabric but wanted to<BR>
reach out to the list to confirm my suspicions.  The odd part is that even<BR>
when the MDS complains that it cannot connect to a given ost, lctl ping to<BR>
the OSS that owns the OST works without an issue.  Also, the OSS in question<BR>
has other OSTs which, in the latest case, have not reported any errors.<BR>
<BR>
I have attached a file with the errors that I encountered from the MDS.  I<BR>
am running Lustre 1.6.6 with a a pair of MDSs and 8 OSS and 28 OSTs spread<BR>
across the the 8 OSSs.  I am using IB DDR interconnects between all systems.<BR>
<BR>
Thanks,<BR>
<BR>
</FONT>
</P>

</BODY>
</HTML>