<div>Though I think its marked as development or experimental in the Lustre documention or source "lctl set_route" has worked fine for me in the past with no issues.</div>
<div> </div>
<div>lctl set_route <nid> up</div>
<div> </div>
<div>is the syntax I believe.</div>
<div> </div>
<div>Jeremy<br><br></div>
<div class="gmail_quote">On Tue, Jan 25, 2011 at 9:52 AM, Michael Kluge <span dir="ltr"><<a href="mailto:Michael.Kluge@tu-dresden.de">Michael.Kluge@tu-dresden.de</a>></span> wrote:<br>
<blockquote style="BORDER-LEFT: #ccc 1px solid; MARGIN: 0px 0px 0px 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">Jason, Michael,<br><br>thanks y lot for your replies. I pinged everone from all directions but<br>the router is still marked "down" on the client. I even removed and<br>
re-added the router entry via lctl --net tcp1 del_route xyz@o2ib and<br>lctl --net tcp1 add_route xyz@o2ib . No luck. So I think I'll wait for<br>the next maintenance window. Oh, and I forgot to mention that the<br>servers run a 1.6.7.2, the router as well and the clients 1.8.5. Works<br>
good so far.<br><br><br>Thanks, Michael<br><br><br>Am Dienstag, den 25.01.2011, 15:12 +0100 schrieb Temple Jason:<br>
<div>
<div></div>
<div class="h5">> I've found that even with the Protocal Error, it still works.<br>><br>> -Jason<br>><br>> -----Original Message-----<br>> From: <a href="mailto:lustre-discuss-bounces@lists.lustre.org">lustre-discuss-bounces@lists.lustre.org</a> [mailto:<a href="mailto:lustre-discuss-bounces@lists.lustre.org">lustre-discuss-bounces@lists.lustre.org</a>] On Behalf Of Michael Shuey<br>
> Sent: martedì, 25. gennaio 2011 14:45<br>> To: Michael Kluge<br>> Cc: Lustre Diskussionsliste<br>> Subject: Re: [Lustre-discuss] "up" a router that is marked "down"<br>><br>> You'll want to add the "dead_router_check_interval" lnet module<br>
> parameter as soon as you are able.  As near as I can tell, without<br>> that there's no automatic check to make sure the router is alive.<br>><br>> I've had some success in getting machines to recognize that a router<br>
> is alive again by doing an lctl ping of their side of a router (e.g.,<br>> on a tcp0 client, `lctl ping <routerIP>@tcp0`, then `lctl ping<br>> <routerIP>@o2ib0` from an o2ib0 client).  If you have a server/client<br>
> version mismatch, where lctl ping returns a protocol error, you may be<br>> out of luck.<br>><br>> --<br>> Mike Shuey<br>><br>><br>><br>> On Tue, Jan 25, 2011 at 8:38 AM, Michael Kluge<br>> <<a href="mailto:Michael.Kluge@tu-dresden.de">Michael.Kluge@tu-dresden.de</a>> wrote:<br>
> > Hi list,<br>> ><br>> > if a Lustre router is down, comes back to life and the servers do not<br>> > actively test the routers periodically: is it possible to mark a Lustre<br>> > router as "up"? Or to tell the servers to ping the router?<br>
> ><br>> > Or can I enable the "router pinger" in a live system without unloading<br>> > and loading the Lustre kernel modules?<br>> ><br>> ><br>> > Regards, Michael<br>> ><br>
> > --<br>> ><br>> > Michael Kluge, M.Sc.<br>> ><br>> > Technische Universität Dresden<br>> > Center for Information Services and<br>> > High Performance Computing (ZIH)<br>> > D-01062 Dresden<br>
> > Germany<br>> ><br>> > Contact:<br>> > Willersbau, Room A 208<br>> > Phone:  (+49) 351 463-34217<br>> > Fax:    (+49) 351 463-37773<br>> > e-mail: <a href="mailto:michael.kluge@tu-dresden.de">michael.kluge@tu-dresden.de</a><br>
> > WWW:    <a href="http://www.tu-dresden.de/zih" target="_blank">http://www.tu-dresden.de/zih</a><br>> ><br>> > _______________________________________________<br>> > Lustre-discuss mailing list<br>
> > <a href="mailto:Lustre-discuss@lists.lustre.org">Lustre-discuss@lists.lustre.org</a><br>> > <a href="http://lists.lustre.org/mailman/listinfo/lustre-discuss" target="_blank">http://lists.lustre.org/mailman/listinfo/lustre-discuss</a><br>
> ><br>> ><br>> _______________________________________________<br>> Lustre-discuss mailing list<br>> <a href="mailto:Lustre-discuss@lists.lustre.org">Lustre-discuss@lists.lustre.org</a><br>> <a href="http://lists.lustre.org/mailman/listinfo/lustre-discuss" target="_blank">http://lists.lustre.org/mailman/listinfo/lustre-discuss</a><br>
><br><br></div></div>--<br>
<div>
<div></div>
<div class="h5"><br>Michael Kluge, M.Sc.<br><br>Technische Universität Dresden<br>Center for Information Services and<br>High Performance Computing (ZIH)<br>D-01062 Dresden<br>Germany<br><br>Contact:<br>Willersbau, Room A 208<br>
Phone:  (+49) 351 463-34217<br>Fax:    (+49) 351 463-37773<br>e-mail: <a href="mailto:michael.kluge@tu-dresden.de">michael.kluge@tu-dresden.de</a><br>WWW:    <a href="http://www.tu-dresden.de/zih" target="_blank">http://www.tu-dresden.de/zih</a><br>
</div></div><br>_______________________________________________<br>Lustre-discuss mailing list<br><a href="mailto:Lustre-discuss@lists.lustre.org">Lustre-discuss@lists.lustre.org</a><br><a href="http://lists.lustre.org/mailman/listinfo/lustre-discuss" target="_blank">http://lists.lustre.org/mailman/listinfo/lustre-discuss</a><br>
<br></blockquote></div><br>