<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body dir="auto">
This issue is really kicking our behinds:
<div dir="ltr"></div>
<div><a href="https://jira.whamcloud.com/browse/LU-11465">https://jira.whamcloud.com/browse/LU-11465</a></div>
<div><br>
</div>
<div>While we're waiting for the issue to get some attention from Lustre developers, are there suggestions on how we can recover our cluster from this kind of deadlocked, stuck-threads-on-the-MDS (or OSS) situation?  Rebooting the storage servers does not clear
 the hang-up, as upon reboot the MDS quickly ends up with the same number of D-state threads (around the same number as we have clients).  It seems to me like there is some state stashed away in the filesystem which restores the deadlock as soon as the MDS
 comes up.</div>
<div><br>
</div>
<div>Thanks and regards,</div>
<div><br>
</div>
<div>Marion</div>
<div><br>
</div>
</body>
</html>