<html><head><meta http-equiv="content-type" content="text/html; charset=GB2312"><style>body { line-height: 1.5; }body { font-size: 10.5pt; font-family: Î¢ÈíÑźÚ; color: rgb(0, 0, 0); line-height: 1.5; }body { font-size: 10.5pt; font-family: Î¢ÈíÑźÚ; color: rgb(0, 0, 0); line-height: 1.5; }</style></head><body> 
<div style="FONT-FAMILY: Tahoma"><span></span>Hi£¬ </div><div style="FONT-FAMILY: Tahoma"><br></div><div><span style="font-family: Tahoma;">For hardware compatibiility reason, we just upgraded a 2.5.3 instance to 2.10.6.  After that, when we tried to mount a new formated OST on 2.10.6, we got  failures on OSS. Here is the </span><span style="font-family: Tahoma; color: rgb(0, 0, 0); background-color: rgba(0, 0, 0, 0);">symptom</span><span style="font-family: Tahoma;">:</span></div><div><span style="font-family: Tahoma;">1. The ost mount operation will stuck for about 10 mins, and then we got ¡°Is the MGS running?...¡±</span><span style="font-family: Tahoma; font-size: 10.5pt; line-height: 1.5; background-color: window;"> on terminal </span></div><div><span style="font-family: Tahoma; font-size: 10.5pt; line-height: 1.5; background-color: window;">2. In syslog, we found</span></div><div><span style="font-family: Tahoma; font-size: 10.5pt; line-height: 1.5; background-color: window;"> </span><span style="font-family: Tahoma; color: rgb(0, 0, 0); font-size: 10.5pt; line-height: 1.5; background-color: rgba(0, 0, 0, 0);">LustreError: 166-1: MGC192.168.50.63@tcp: Connection to MGS (at 192.168.50.63@tcp) was lost; in progress operations using this service will fail </span></div><span style="font-family: Tahoma; color: rgb(0, 0, 0); background-color: rgba(0, 0, 0, 0);">  </span><span style="font-family: Tahoma;"> LustreError: 105461:0:(ldlm_request.c:148:ldlm_expired_completion_wait()) ### lock timed out (enqueued at 1545962328, 300s ago), entering recovery for MGS@MGC192.168.50.63@tcp_0 ns: MGC192.168.50.63@tcp lock: ffff9ae9283b8200/0xa4c148c2f2e256b9 lrc: 4/1,0 mode: -/CR res: [0x73666361:0x0:0x0].0x0 rrc: 3 type: PLN flags: 0x1000000000000 nid: local remote: 0x38d3cf901311c189 expref: -99 pid: 105461 timeout: 0 lvb_type: 0</span><div style="FONT-FAMILY: Tahoma"><span style="font-size: 10.5pt; line-height: 1.5; background-color: window;">3. During the stuck, we can see  ll_OST_XX and lazyldiskfsinit running on the new OSS, but the obdfilter directory can not be found under /proc/fs/lustre</span></div><div style="FONT-FAMILY: Tahoma"><span style="font-size: 10.5pt; line-height: 1.5; background-color: window;">4. On MDS+MGS node, we got  </span></div><div style="FONT-FAMILY: Tahoma">   "<span style="background-color: rgba(0, 0, 0, 0); font-size: 10.5pt; line-height: 1.5;"> 166-1: MGC192.168.50.63@tcp: Connection to MGS (at 0@lo) was lost; in progress operations using this service will fail</span><span style="font-size: 10.5pt; line-height: 1.5; background-color: window;">" on MGS</span></div><div style="FONT-FAMILY: Tahoma"><span style="font-size: 10.5pt; line-height: 1.5; background-color: window;">5. After that , other new clients cannot mount the system.  </span></div><div style="FONT-FAMILY: Tahoma"><span style="font-size: 10.5pt; line-height: 1.5; background-color: window;">6. It seemed the OST mount operation had caused problems on MGS, so we umounted the MDT and run e2fsck, and remount it.  </span></div><div style="FONT-FAMILY: Tahoma"><span style="font-size: 10.5pt; line-height: 1.5; background-color: window;">7. After that,client mount  is possible, and we got deactivate ost on "lfs df".</span></div><div style="FONT-FAMILY: Tahoma"><span style="font-size: 10.5pt; line-height: 1.5; background-color: window;">8. When we tried to mount the new OSS, the symptom repeat again...</span></div><div style="FONT-FAMILY: Tahoma"><span style="font-size: 10.5pt; line-height: 1.5; background-color: window;"><br></span></div><div style="FONT-FAMILY: Tahoma">Any one has a hint on this problem?</div><div style="FONT-FAMILY: Tahoma"><br></div><div style="FONT-FAMILY: Tahoma">Cheers,</div><div style="FONT-FAMILY: Tahoma">Lu</div><div style="FONT-FAMILY: Tahoma"><br></div>
<div></div>
<div><div style="font-family: Î¢ÈíÑźÚ, Tahoma; font-size: 14px; line-height: normal;">====================================================================</div><div style="font-family: Î¢ÈíÑźÚ, Tahoma; font-size: 14px; line-height: normal;">Computing center,the Institute of High Energy Physics, CAS, China</div><div style="font-family: Î¢ÈíÑźÚ, Tahoma; font-size: 14px; line-height: normal;">Wang Lu                                        Tel: (+86) 10 8823 6087</div><div style="font-family: Î¢ÈíÑźÚ, Tahoma; font-size: 14px; line-height: normal;">P.O. Box 918-7                               Fax: (+86) 10 8823 6839</div><div style="font-family: Î¢ÈíÑźÚ, Tahoma; font-size: 14px; line-height: normal;">Beijing 100049  P.R. China            Email: Lu.Wang@ihep.ac.cn</div><div style="font-family: Î¢ÈíÑźÚ, Tahoma; font-size: 14px; line-height: normal;">===================================================================</div></div>
</body></html>