Ok, I inherited a lustre filesystem used on a cluster. <div><br></div><div>I am seeing an issue where on the frontend, I see all of /work</div><div>On nodes, however, I only see SOME of the user's directories.</div><div>
<br></div><div>Work consists of one MDT/MGS and 3 osts</div><div>The osts are LVMs served from a DDN via infiniband</div><div><br></div><div>Running the kernel modules/client one the nodes/frontend<br><div><div>lustre-client-1.8.2-2.6.18_164.11.1.el5_lustre.1.8.2</div>
<div>lustre-client-modules-1.8.2-2.6.18_164.11.1.el5_lustre.1.8.2</div></div><div><br></div><div>on the ost/mdt</div><div><div>lustre-modules-1.8.2-2.6.18_164.11.1.el5_lustre.1.8.2</div><div>kernel-2.6.18-164.11.1.el5_lustre.1.8.2</div>
<div>lustre-1.8.2-2.6.18_164.11.1.el5_lustre.1.8.2</div><div>lustre-ldiskfs-3.0.9-2.6.18_164.11.1.el5_lustre.1.8.2</div></div><div><br></div><div>I have so many error messages in the logs, I am not sure which to sift through for this issue.</div>
</div><div>A quick tail on the MDT:</div><div>=========================</div><div><div>Apr 27 16:15:19 nas-0-1 kernel: LustreError: 4133:0:(ldlm_lib.c:1848:target_send_reply_msg()) @@@ processing error (-107)  req@ffff810669d35c50 x1334203739385128/t0 o400-><?>@<?>:0/0 lens 192/0 e 0 to 0 dl 1272410135 ref 1 fl Interpret:H/0/0 rc -107/0</div>
<div>Apr 27 16:15:19 nas-0-1 kernel: LustreError: 4133:0:(ldlm_lib.c:1848:target_send_reply_msg()) Skipped 419 previous similar messages</div><div>Apr 27 16:16:38 nas-0-1 kernel: LustreError: 4155:0:(handler.c:1518:mds_handle()) operation 400 on unconnected MDS from 12345-10.1.255.55@tcp</div>
<div>Apr 27 16:16:38 nas-0-1 kernel: LustreError: 4155:0:(handler.c:1518:mds_handle()) Skipped 177 previous similar messages</div><div>Apr 27 16:25:21 nas-0-1 kernel: LustreError: 6789:0:(mgs_handler.c:573:mgs_handle()) lustre_mgs: operation 400 on unconnected MGS</div>
<div>Apr 27 16:25:21 nas-0-1 kernel: LustreError: 6789:0:(mgs_handler.c:573:mgs_handle()) Skipped 229 previous similar messages</div><div>Apr 27 16:25:21 nas-0-1 kernel: LustreError: 6789:0:(ldlm_lib.c:1848:target_send_reply_msg()) @@@ processing error (-107)  req@ffff810673a78050 x1334009404220652/t0 o400-><?>@<?>:0/0 lens 192/0 e 0 to 0 dl 1272410737 ref 1 fl Interpret:H/0/0 rc -107/0</div>
<div>Apr 27 16:25:21 nas-0-1 kernel: LustreError: 6789:0:(ldlm_lib.c:1848:target_send_reply_msg()) Skipped 404 previous similar messages</div><div>Apr 27 16:26:41 nas-0-1 kernel: LustreError: 4173:0:(handler.c:1518:mds_handle()) operation 400 on unconnected MDS from 12345-10.1.255.46@tcp</div>
<div>Apr 27 16:26:41 nas-0-1 kernel: LustreError: 4173:0:(handler.c:1518:mds_handle()) Skipped 181 previous similar messages</div></div><div>=========================</div><div><br></div><div>Any direction/insigt would be most helpful.</div>
<div><br></div><div>Brian Andrus</div><div><br></div>