I seen the error when we had mix of FDR (using mlx4) and EDR(using mlx5) devices in lustre network.  server_bulk_callback should have the corresponding client_bulk_callback in client. <br><br> <a href="http://wiki.lustre.org/Infiniband_Configuration_Howto">http://wiki.lustre.org/Infiniband_Configuration_Howto</a> <br><div class="gmail_quote"><div dir="ltr">On Thu, Jun 7, 2018 at 11:24 AM Hebenstreit, Michael <<a href="mailto:michael.hebenstreit@intel.com">michael.hebenstreit@intel.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">No, clients do not show any issues. <br>
<br>
-----Original Message-----<br>
From: White, Cliff <br>
Sent: Thursday, June 07, 2018 9:26 AM<br>
To: Hebenstreit, Michael <<a href="mailto:michael.hebenstreit@intel.com" target="_blank">michael.hebenstreit@intel.com</a>>; lustre-discuss <<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a>><br>
Subject: Re: [lustre-discuss] server_bulk_callback errors until server reboots<br>
<br>
<br>
On 6/7/18, 7:00 AM, "lustre-discuss on behalf of Hebenstreit, Michael" <<a href="mailto:lustre-discuss-bounces@lists.lustre.org" target="_blank">lustre-discuss-bounces@lists.lustre.org</a> on behalf of <a href="mailto:michael.hebenstreit@intel.com" target="_blank">michael.hebenstreit@intel.com</a>> wrote:<br>
<br>
    Hello<br>
<br>
    I have now 2 Lustre systems that suddenly show this error - on a single OST the kernel log is filling with messages <br>
<br>
    [58858.365663] LustreError: 123642:0:(events.c:447:server_bulk_callback()) event type 3, status -61, desc ffff880524f7e000<br>
    [58865.328317] LustreError: 123640:0:(events.c:447:server_bulk_callback()) event type 5, status -61, desc ffff880cab4ec800<br>
    [58865.340792] LustreError: 123641:0:(events.c:447:server_bulk_callback()) event type 5, status -61, desc ffff880524f7c600<br>
    [58865.353167] LustreError: 123640:0:(events.c:447:server_bulk_callback()) event type 3, status -61, desc ffff880cab4ec800<br>
    [58865.365503] LustreError: 123641:0:(events.c:447:server_bulk_callback()) event type 3, status -61, desc ffff880524f7c600<br>
<br>
    until the server reboots. Clients are on 2.11/RH7.5, servers are on <a href="http://2.7.19.10/RH7.4" rel="noreferrer" target="_blank">2.7.19.10/RH7.4</a> . Has anyone experienced this before?<br>
<br>
There should be some corresponding error messages on your clients, have you checked there? <br>
cliffw<br>
<br>
    Thanks<br>
    Michael<br>
<br>
    ------------------------------------------------------------------------<br>
    Michael Hebenstreit                 Senior Cluster Architect<br>
    Intel Corporation, MS: RR1-105/H14  Core and Visual Compute Group (DCE)<br>
    <a href="https://maps.google.com/?q=4100+Sara+Road&entry=gmail&source=g">4100 Sara Road</a>                      Tel.:   +1 505-794-3144 <br>
    Rio Rancho, NM 87124<br>
    UNITED STATES                       E-mail: <a href="mailto:michael.hebenstreit@intel.com" target="_blank">michael.hebenstreit@intel.com</a><br>
<br>
<br>
<br>
    _______________________________________________<br>
    lustre-discuss mailing list<br>
    <a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a><br>
    <a href="http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org" rel="noreferrer" target="_blank">http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org</a><br>
<br>
<br>
_______________________________________________<br>
lustre-discuss mailing list<br>
<a href="mailto:lustre-discuss@lists.lustre.org" target="_blank">lustre-discuss@lists.lustre.org</a><br>
<a href="http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org" rel="noreferrer" target="_blank">http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org</a><br>
</blockquote></div>