<HTML>
<HEAD>
<TITLE>Re: [Lustre-discuss] lustre can not mounted problem</TITLE>
</HEAD>
<BODY>
<FONT FACE="Verdana, Helvetica, Arial"><SPAN STYLE='font-size:12.0px'><BR>
If you’re using IPoIB, you can use standard TCP/IP diagnostic tools the same way you would on an Ethernet link (ifconfig, ping, traceroute, telnet, etc.)<BR>
<BR>
If you’re using a copper-to-optical converter in your data path as well, the Emcore MIAs have link lights on them which will tell you if a physical link is present (check the documentation). I know with STP InfiniBand connectors, there is some ambiguity about terminology with some vendors and manufacturers, and the fibre arrangement doesn’t provide a lot of wiggle room.<BR>
<BR>
Klaus<BR>
<BR>
On 1/7/08 7:56 PM, "Changer Van" <changerv@gmail.com>did etch on stone tablets:<BR>
<BR>
</SPAN></FONT><BLOCKQUOTE><FONT FACE="Verdana, Helvetica, Arial"><SPAN STYLE='font-size:12.0px'><BR>
<BR>
On Jan 8, 2008 1:35 AM, Isaac Huang <He.Huang@sun.com> wrote:<BR>
</SPAN></FONT><BLOCKQUOTE><FONT FACE="Verdana, Helvetica, Arial"><SPAN STYLE='font-size:12.0px'>On Mon, Jan 07, 2008 at 06:20:52PM +0800, Changer Van wrote:<BR>
>    ......<BR>
>    # dmesg<BR>
><BR>
>    LustreError: 4273:0:(viblnd.c:1890:kibnal_startup())<BR>
><BR>
>             Can't find an active port on InfiniHost_III_Ex0<BR>
<BR>
It meant that viblnd couldn't find a port whose link state was active <BR>
on the hca InfiniHost_III_Ex0, i.e. no link on the device was usable.<BR>
<BR>
Was there any other error messages from viblnd before this one? <BR>
</SPAN></FONT></BLOCKQUOTE><FONT FACE="Verdana, Helvetica, Arial"><SPAN STYLE='font-size:12.0px'>There was no error messages but a related message <BR>
like 'ADDRCONF(NETDEV_UP):ipoib0: link is not ready'.<BR>
</SPAN></FONT><BLOCKQUOTE><FONT FACE="Verdana, Helvetica, Arial"><SPAN STYLE='font-size:12.0px'>Did you see this problem on just one node?<BR>
</SPAN></FONT></BLOCKQUOTE><FONT FACE="Verdana, Helvetica, Arial"><SPAN STYLE='font-size:12.0px'>There are four nodes which can not mount the lustre system.<BR>
The other nodes can mount the lustre but got the following error messages:<BR>
 <BR>
# dmesg<BR>
divert: not allocating divert_blk for non-ethernet device ipoib0<BR>
ERROR   : IPOIB_UD : ipoib_ud_find_dev_by_dst:(ipoib_ud_arp.c):<BR>
     ip_route_output_key(127.0.0.1 <a href="http://127.0.0.1"><http://127.0.0.1></a> ) failed <BR>
new: ipoib_allow_arp_joins: 1<BR>
ERROR   : IPOIB_UD : ipoib_ud_find_dev_by_dst:(ipoib_ud_arp.c):<BR>
     ip_route_output_key(11.0.0.4 <a href="http://11.0.0.4"><http://11.0.0.4></a> ) failed<BR>
ERROR   : IPOIB_UD : ipoib_ud_find_dev_by_dst:(ipoib_ud_arp.c):<BR>
     ip_route_output_key(11.0.0.4 <a href="http://11.0.0.4"><http://11.0.0.4></a> ) failed<BR>
ERROR   : IPOIB_UD : ipoib_ud_find_dev_by_dst:(ipoib_ud_arp.c):<BR>
     ip_route_output_key(11.0.0.4 <a href="http://11.0.0.4"><http://11.0.0.4></a> ) failed<BR>
 <BR>
How can I check the link on the device? Thanks in advance.<BR>
</SPAN></FONT></BLOCKQUOTE><FONT FACE="Verdana, Helvetica, Arial"><SPAN STYLE='font-size:12.0px'><BR>
</SPAN></FONT>
</BODY>
</HTML>