<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);">
I can't tell, any commands I run against the files in question hang indefinitely.  It seems very suspicious though.<br>
</div>
<div>
<div id="appendonsend"></div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<hr tabindex="-1" style="display:inline-block; width:98%">
<div id="divRplyFwdMsg" dir="ltr"><font style="font-size: 11pt;" data-ogsc="" face="Calibri, sans-serif" color="#000000"><b>From:</b> Mohr Jr, Richard Frank <rmohr@utk.edu><br>
<b>Sent:</b> Tuesday, March 31, 2020 3:41 PM<br>
<b>To:</b> Kurt Strosahl <strosahl@jlab.org><br>
<b>Cc:</b> lustre-discuss@lists.lustre.org <lustre-discuss@lists.lustre.org>; sciadm@jlab.org <sciadm@jlab.org><br>
<b>Subject:</b> [EXTERNAL] Re: [lustre-discuss] Files hanging on lustre clients</font>
<div> </div>
</div>
<div class="BodyFragment"><font size="2"><span style="font-size:11pt">
<div class="PlainText"><br>
<br>
> On Mar 31, 2020, at 2:36 PM, Kurt Strosahl <strosahl@jlab.org> wrote:<br>
> <br>
> an strace on an ls command run against some of these files produced the following:<br>
> getxattr("/volatile/halld/home/haoli/RunPeriod-2017-01/analysis/ver36_Mar27/log/030408/stdout.030408_124.out", "system.posix_acl_default", NULL, 0) = -1 ENODATA (No data available)<br>
> lstat("/volatile/halld/home/haoli/RunPeriod-2017-01/analysis/ver36_Mar27/log/030408/stderr.030408_118.err", {st_mode=S_IFREG|0644, st_size=16979, ...}) = 0<br>
> getxattr("/volatile/halld/home/haoli/RunPeriod-2017-01/analysis/ver36_Mar27/log/030408/stderr.030408_118.err", "system.posix_acl_access", NULL, 0) = -1 ENODATA (No data available)<br>
> getxattr("/volatile/halld/home/haoli/RunPeriod-2017-01/analysis/ver36_Mar27/log/030408/stderr.030408_118.err", "system.posix_acl_default", NULL, 0) = -1 ENODATA (No data available)<br>
> lstat("/volatile/halld/home/haoli/RunPeriod-2017-01/analysis/ver36_Mar27/log/030408/stdout.030408_000.out",<br>
<br>
<snip><br>
<br>
> Lustre: lustre19-OST0028-osc-ffff88105fecd000: Connection to lustre19-OST0028 (at 172.17.0.99@o2ib) was lost; in progress operations using this service will wait for recovery to complete<br>
> Lustre: lustre19-OST0028-osc-ffff88105fecd000: Connection restored to lustre19-OST0028 (at 172.17.0.99@o2ib)<br>
<br>
Of the files listed in the strace above that gave errors, are all those files striped across OST0028?<br>
<br>
—<br>
Rick Mohr<br>
Senior HPC System Administrator<br>
Joint Institute for Computational Sciences<br>
University of Tennessee<br>
<br>
<br>
<br>
<br>
</div>
</span></font></div>
</div>
</body>
</html>