<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
To clarify, the lnet_compare_routes() does look at peer credits, but only if priority, hops and queued nob are all the same. It would probably be better to weight all of these things together as was suggested at one of the developer conferences recently.
<div class=""><br class="">
</div>
<div class="">Chris Horn</div>
<div class=""><br class="">
<div>
<blockquote type="cite" class="">
<div class="">On Aug 19, 2015, at 4:14 PM, Chris Horn <<a href="mailto:hornc@cray.com" class="">hornc@cray.com</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
We could more easily help that situation by changing the lnet_compare_routes() method to look at the number of credits available when deciding which router peer to use as a next hop.
<div class=""><br class="">
</div>
<div class="">Chris Horn</div>
<div class=""><br class="">
<div class="">
<blockquote type="cite" class="">
<div class="">On Aug 19, 2015, at 3:54 PM, Alexey Lyashkov <<a href="mailto:alexey.lyashkov@seagate.com" class="">alexey.lyashkov@seagate.com</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div dir="ltr" class="">
<div class="gmail_extra">In my invested case, I have see large number tx in sending queue with negative credits. it's mean we don't able to resend these messages via different gateway until message expired. But if we stop to queue messages with reach a zero
 credits, we will able to send message via different gateway after peer dead event without any notifications to ptlrpc layer. So i think it's likely to be a bug as from my point view, we need to avoid ptlrpc reconnects as possible.</div>
<div class="gmail_extra"><br class="">
<div class="gmail_quote">On Wed, Aug 19, 2015 at 11:48 PM, Christopher J. Morrone
<span dir="ltr" class=""><<a href="mailto:morrone2@llnl.gov" target="_blank" class="">morrone2@llnl.gov</a>></span> wrote:<br class="">
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div id=":1k8" class="a3s" style="overflow:hidden">LNet does stop sending LNet messages on a peer connection when that peer's credit count reaches zero.  LNet chose to then relate the count of messages awaiting credits by using negative values of the same variable. 
 It is just the convention chosen, and doesn't necessarily mean that there is a design problem there.<br class="">
</div>
</blockquote>
</div>
<br class="">
<br class="">
<br clear="all" class="">
<div class=""><br class="">
</div>
-- <br class="">
<div class="gmail_signature">
<div dir="ltr" class="">Alexey Lyashkov <strong class="">ยท</strong> Technical lead for a Morpheus team<br class="">
Seagate Technology, LLC<br class="">
<a href="http://www.seagate.com/" target="_blank" class="">www.seagate.com</a><br class="">
<div class=""><a href="http://www.lustre.org/" target="_blank" class="">www.lustre.org</a></div>
</div>
</div>
</div>
</div>
_______________________________________________<br class="">
lustre-devel mailing list<br class="">
<a href="mailto:lustre-devel@lists.lustre.org" class="">lustre-devel@lists.lustre.org</a><br class="">
<a href="http://lists.lustre.org/listinfo.cgi/lustre-devel-lustre.org" class="">http://lists.lustre.org/listinfo.cgi/lustre-devel-lustre.org</a><br class="">
</div>
</blockquote>
</div>
<br class="">
</div>
</div>
</div>
</blockquote>
</div>
<br class="">
</div>
</body>
</html>