<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" style="display:none;"><!-- P {margin-top:0;margin-bottom:0;} --></style>
</head>
<body dir="ltr">
<div id="divtagdefaultwrapper" style="font-size:12pt;color:#000000;font-family:Calibri,Helvetica,sans-serif;" dir="ltr">
<p style="margin-top:0;margin-bottom:0">Hello List!</p>
<p style="margin-top:0;margin-bottom:0"><br>
</p>
<p style="margin-top:0;margin-bottom:0">We're working on creating a new Lustre instance using Lustre 2.12.1 on Centos 7.6 and are running into problems when trying to mount OSTs.
<br>
</p>
<p style="margin-top:0;margin-bottom:0"><br>
</p>
<p style="margin-top:0;margin-bottom:0">When trying to attach a new OST we get this message on the MDS server:</p>
<p style="margin-top:0;margin-bottom:0"><br>
</p>
<p style="margin-top:0;margin-bottom:0"><span>LustreError:</span>(events.c:305:request_in_callback()) event type 2, status -103, service mgs<br>
</p>
<p style="margin-top:0;margin-bottom:0"><span><span>LustreError:</span>(pack_generic.c:590:__lustre_unpack_msg()) message length 0 too small for magic/version check</span></p>
<p style="margin-top:0;margin-bottom:0"><span>LustreError:</span>(pack_generic.c:590:__lustre_unpack_msg()) Skipped 1 previous similar message</p>
<p style="margin-top:0;margin-bottom:0"><span>LustreError:</span>(sec.c:2191:sptlrpc_svc_unwrap_request()) error unpacking request from 12345=200.1.20.205@o2ib x1633617112465632<br>
</p>
<p style="margin-top:0;margin-bottom:0"><span><span>LustreError:</span>(sec.c:2191:sptlrpc_svc_unwrap_request())</span> Skipped 1 previous similar message</p>
<p style="margin-top:0;margin-bottom:0"><span>LustreError:</span>(o2iblnd_cb.c:3325:kiblnd_check_txs_locked()) Timed out tx: active_txs, 0 seconds</p>
<p style="margin-top:0;margin-bottom:0"><span>LustreError:</span>(o2iblnd_cb.c:3400:kiblnd_check_conns()) Timed out RDMA with
<span>200.1.20.205</span>@o2ib (6): c: 8, oc: 0, rc: 8</p>
<p style="margin-top:0;margin-bottom:0"><span>LustreError:</span>(events.c:305:request_in_callback()) event type 2, status -103, service mgs<br>
</p>
<p style="margin-top:0;margin-bottom:0"><br>
</p>
<p style="margin-top:0;margin-bottom:0"><br>
</p>
<p style="margin-top:0;margin-bottom:0">The confusing thing is that several OSTs had already been mounted successfully and we can find no configuration differences between the OSTs that mount and the OSTs that do not. The network is 100GB Ethernet using RoCE
 and lnetctl ping completes successfully on all the servers. <br>
</p>
<p style="margin-top:0;margin-bottom:0"><br>
</p>
<p style="margin-top:0;margin-bottom:0">Does anybody have any thoughts on what might be causing these errors and any way to address them?
<br>
</p>
<p style="margin-top:0;margin-bottom:0"><br>
</p>
<p style="margin-top:0;margin-bottom:0">Thanks!<br>
</p>
</div>
</body>
</html>