<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
Dear Lustre Users,
<div class=""><br class="">
</div>
<div class="">There was an issue with a degraded volume group.</div>
<div class="">After replacing the failed disks and mount the OST in question, I get the following error:</div>
<div class=""><br class="">
</div>
<div class="">From OSS side:</div>
<div class="">
<div class=""># mount -v -t lustre /ost_5</div>
<div class="">arg[0] = /sbin/mount.lustre</div>
<div class="">arg[1] = -v</div>
<div class="">arg[2] = -o</div>
<div class="">arg[3] = rw</div>
<div class="">arg[4] = /dev/sdg</div>
<div class="">arg[5] = /ost_5</div>
<div class="">source = /dev/sdg (/dev/sdg), target = /ost_5</div>
<div class="">options = rw</div>
<div class="">checking for existing Lustre data: found</div>
<div class="">Reading CONFIGS/mountdata</div>
<div class="">mounting device /dev/sdg at /ost_5, flags=0x1000000 options=osd=osd-ldiskfs,,errors=remount-ro,mgsnode=172.21.49.70@tcp,writeconf,param=mgsnode=172.21.49.70@tcp,svname=ana04-OST0005,device=/dev/sdg</div>
<div class="">mount.lustre: mount /dev/sdg at /ost_5 failed: File exists retries left: 0</div>
<div class="">mount.lustre: mount /dev/sdg at /ost_5 failed: File exists</div>
</div>
<div class=""><br class="">
</div>
<div class="">From the MDS Side:</div>
<div class="">
<div class=""> MGS: Connection restored to 172.21.52.57@o2ib (at 172.21.49.57@tcp)</div>
<div class="">Jun  1 08:52:13 kernel: [283815.063427] Lustre: MGS: Regenerating ana04-OST0005 log by user request.</div>
<div class="">Jun  1 08:52:13  kernel: [283815.063435] Lustre: Found index 5 for ana04-OST0005, updating log</div>
<div class="">Jun  1 08:52:13  kernel: [283815.063588] Lustre: Client log for ana04-OST0005 was not updated; writeconf the MDT first to regenerate it.</div>
<div class="">Jun  1 08:52:16  kernel: [283818.785764] Lustre: ana04-MDT0000: Connection restored to 172.21.52.57@o2ib (at 172.21.49.57@tcp)</div>
<div class="">Jun  1 08:56:56  kernel: [284098.343206] Lustre: 21769:0:(client.c:2063:ptlrpc_expire_one_request()) @@@ Request sent has timed out for slow reply: [sent 1591026960/real 1591026960]  req@ffff8803cbb52d00 x1668283989359148/t0(0) o8-><a href="mailto:ana04-OST0004-osc-MDT0000@172.21.49.57" class="">ana04-OST0004-osc-MDT0000@172.21.49.57</a>@tcp:28/4
 lens 520/544 e 0 to 1 dl 1591027016 ref 1 fl Rpc:XN/0/ffffffff rc 0/-1</div>
<div class="">Jun  1 08:56:56  kernel: [284098.343214] Lustre: 21769:0:(client.c:2063:ptlrpc_expire_one_request()) Skipped 96 previous similar messages</div>
</div>
<div class=""><br class="">
</div>
<div class="">Any input would be greatly appreciated it.</div>
<div class="">Thank you,</div>
<div class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div>— <br class="">
Omar E. Quijano<br class="">
LCLS IT/Networking Department Head<br class="">
SLAC National Accelerator Laboratory <br class="">
T: (650) 926-5436</div>
</div>
</div>
<br class="">
</body>
</html>