<div>Network connection is down. I can not ping the other nodes.</div>
<div>I ran the vstat command and found one of the port_state is 'port_initialize'.</div>
<div>What does 'port_initialize' mean? Dose it mean my ib card is broken?</div>
<div> </div>
<div>1 HCA found:<br>        hca_id=InfiniHost_III_Ex0<br>        pci_location={BUS=0x20,DEV/FUNC=0x00}<br>        vendor_id=0x02C9<br>        vendor_part_id=0x6282<br>        hw_ver=0xA0<br>        fw_ver=5.1.400<br>        PSID=MT_0140000001
<br>        num_phys_ports=2<br>                port=1<br>                port_state=PORT_INITIALIZE<br>                sm_lid=0x0000<br>                port_lid=0x0000<br>                port_lmc=0x00<br>                max_mtu=2048
</div>
<div>                port=2<br>                port_state=PORT_DOWN<br>                sm_lid=0x0000<br>                port_lid=0x0000<br>                port_lmc=0x00<br>                max_mtu=2048</div>
<div>-- <br>Regards,<br>Changer <br><br></div>
<div class="gmail_quote">On Jan 9, 2008 3:27 AM, Klaus Steden <<a href="mailto:klaus.steden@thomson.net">klaus.steden@thomson.net</a>> wrote:<br>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">
<div><font face="Verdana, Helvetica, Arial"><span style="FONT-SIZE: 12px"><br>If you're using IPoIB, you can use standard TCP/IP diagnostic tools the same way you would on an Ethernet link (ifconfig, ping, traceroute, telnet, etc.)
<br><br>If you're using a copper-to-optical converter in your data path as well, the Emcore MIAs have link lights on them which will tell you if a physical link is present (check the documentation). I know with STP InfiniBand connectors, there is some ambiguity about terminology with some vendors and manufacturers, and the fibre arrangement doesn't provide a lot of wiggle room.
<br><br>Klaus<br><br>On 1/7/08 7:56 PM, "Changer Van" <<a href="mailto:changerv@gmail.com" target="_blank">changerv@gmail.com</a>>did etch on stone tablets:<br><br></span></font>
<blockquote>
<div class="Ih2E3d"><font face="Verdana, Helvetica, Arial"><span style="FONT-SIZE: 12px"><br><br>On Jan 8, 2008 1:35 AM, Isaac Huang <<a href="mailto:He.Huang@sun.com" target="_blank">He.Huang@sun.com</a>> wrote:<br>
</span></font>
<blockquote><font face="Verdana, Helvetica, Arial"><span style="FONT-SIZE: 12px">On Mon, Jan 07, 2008 at 06:20:52PM +0800, Changer Van wrote:<br>>    ......<br>>    # dmesg<br>><br>>    LustreError: 4273:0:(viblnd.c
:1890:kibnal_startup())<br>><br>>             Can't find an active port on InfiniHost_III_Ex0<br><br>It meant that viblnd couldn't find a port whose link state was active <br>on the hca InfiniHost_III_Ex0, i.e
. no link on the device was usable.<br><br>Was there any other error messages from viblnd before this one? <br></span></font></blockquote><font face="Verdana, Helvetica, Arial"><span style="FONT-SIZE: 12px">There was no error messages but a related message 
<br>like 'ADDRCONF(NETDEV_UP):ipoib0: link is not ready'.<br></span></font>
<blockquote><font face="Verdana, Helvetica, Arial"><span style="FONT-SIZE: 12px">Did you see this problem on just one node?<br></span></font></blockquote></div><font face="Verdana, Helvetica, Arial"><span style="FONT-SIZE: 12px">

<div class="Ih2E3d">There are four nodes which can not mount the lustre system.<br>The other nodes can mount the lustre but got the following error messages:<br> <br># dmesg<br>divert: not allocating divert_blk for non-ethernet device ipoib0
<br>ERROR   : IPOIB_UD : ipoib_ud_find_dev_by_dst:(ipoib_ud_arp.c):<br></div>     ip_route_output_key(<a href="http://127.0.0.1/" target="_blank">127.0.0.1</a> <a href="http://127.0.0.1/" target="_blank"><http://127.0.0.1>
</a> ) failed 
<div class="Ih2E3d"><br>new: ipoib_allow_arp_joins: 1<br>ERROR   : IPOIB_UD : ipoib_ud_find_dev_by_dst:(ipoib_ud_arp.c):<br></div>     ip_route_output_key(<a href="http://11.0.0.4/" target="_blank">11.0.0.4</a> <a href="http://11.0.0.4/" target="_blank">
<http://11.0.0.4></a> ) failed 
<div class="Ih2E3d"><br>ERROR   : IPOIB_UD : ipoib_ud_find_dev_by_dst:(ipoib_ud_arp.c):<br></div>     ip_route_output_key(<a href="http://11.0.0.4/" target="_blank">11.0.0.4</a> <a href="http://11.0.0.4/" target="_blank">
<http://11.0.0.4></a> ) failed 
<div class="Ih2E3d"><br>ERROR   : IPOIB_UD : ipoib_ud_find_dev_by_dst:(ipoib_ud_arp.c):<br></div>     ip_route_output_key(<a href="http://11.0.0.4/" target="_blank">11.0.0.4</a> <a href="http://11.0.0.4/" target="_blank">
<http://11.0.0.4></a> ) failed 
<div class="Ih2E3d"><br> <br>How can I check the link on the device? Thanks in advance.<br></div></span></font></blockquote><font face="Verdana, Helvetica, Arial"><span style="FONT-SIZE: 12px"><br></span></font></div></blockquote>
</div><br><br clear="all"><br>