<html dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style id="owaParaStyle" type="text/css">P {margin-top:0;margin-bottom:0;}</style>
</head>
<body ocsi="0" fpstyle="1">
<div style="direction: ltr;font-family: Tahoma;color: #000000;font-size: 10pt;">I've seen this kind of error before when doing samba to do something stupid (and let's face it, that most everything with samba)   It was a locking issue I think.   Things were
 being changed/deleted/ (unlinked in actuality)  as the client was trying to do something with it. 
<br>
<br>
 Is the Apache process or it's spawned app(s)  still working on the files in question while serving them up?<br>
That would be my guess here.  Any chance this is across NFS?  Seen that a great deal with this error, it used to cause crashes.<br>
<br>
Ed Wahl<br>
OSC<br>
<br>
<br>
<div style="font-family: Times New Roman; color: #000000; font-size: 16px">
<hr tabindex="-1">
<div style="direction: ltr;" id="divRpF351670"><font face="Tahoma" size="2" color="#000000"><b>From:</b> lustre-discuss [lustre-discuss-bounces@lists.lustre.org] on behalf of E.S. Rosenberg [esr+lustre@mail.hebrew.edu]<br>
<b>Sent:</b> Wednesday, September 02, 2015 7:57 AM<br>
<b>To:</b> lustre-discuss@lists.lustre.org<br>
<b>Subject:</b> [lustre-discuss] refresh file layout error<br>
</font><br>
</div>
<div></div>
<div>
<div dir="ltr">
<div>
<div>Hi all,<br>
<br>
</div>
I am seeing an interesting/annoying problem with lustre and am not really sure what/where to look.<br>
<br>
</div>
When a webserver (galaxy using wsgi/apache2) tries to server (large) files stored on lustre it fails to send the full file and I see the following errors in syslog:<br>
<div>
<div>
<div><br>
Sep  2 11:50:17 hm-02 kernel: LustreError: 6973:0:(vvp_io.c:1197:vvp_io_init()) fs01: refresh file layout [0x200008815:0x217e:0x0] error -13.<br>
Sep  2 11:50:17 hm-02 kernel: LustreError: 6973:0:(file.c:179:ll_close_inode_openhandle()) inode 144115772543738238 mdc close failed: rc = -13<br>
<br>
</div>
<div>If I try to access the files through their direct path (copying to tmp/md5sum/sha512sum) it seems to work without a problem (full file is copied and sums agree, from different nodes).<br>
<br>
</div>
<div>When we switched the storage backend to NFS the server worked fine, so my guess is that there is an issue with the way python tries to read from the 'disk'...<br>
<br>
</div>
<div>Is anyone familiar with the error above?<br>
<br>
</div>
<div>Thanks,<br>
</div>
<div>Eli<br>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>