<div dir="ltr"><div><div><div><div>I hope no-one minds me restoring this thread, I just wanted to report back:<br><br></div>After we switched from vanilla kernel-staging lustre to building from source (lustre 2.8.0 + kernel 4.2.8) this problem ceased to exist, so it must have been an issue of lustre 2.3.64 (kernel) clients not talking properly to lustre 2.5.3 servers.<br><br></div>2.8.0 also doesn't play nice with 2.5.3 so we ended up upgrading our servers too.<br><br></div><div>Which leads me to 2 questions about current development:<br></div><div>1. Has the mainline kernel seen any progress over the past half year? Will we ever be able to just use that (at least for clients)?<br></div><div>2. What is the schedule for 2.9.0?<br></div><div><br></div>Regards and thanks,<br></div>Eli<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Sat, Sep 5, 2015 at 12:08 AM, Patrick Farrell <span dir="ltr"><<a href="mailto:paf@cray.com" target="_blank">paf@cray.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Oops, I'm sorry - this was supposed to be a reply to Amit Kumar's thread.  Apologies.<br>
______________________________<wbr>__________<br>
From: lustre-discuss [<a href="mailto:lustre-discuss-bounces@lists.lustre.org">lustre-discuss-bounces@lists.<wbr>lustre.org</a>] on behalf of Patrick Farrell [<a href="mailto:paf@cray.com">paf@cray.com</a>]<br>
Sent: Friday, September 04, 2015 4:07 PM<br>
To: <a href="mailto:lustre-discuss@lists.lustre.org">lustre-discuss@lists.lustre.<wbr>org</a>; E.S. Rosenberg; Wahl,      Edward<br>
<div class="HOEnZb"><div class="h5">Subject: Re: [lustre-discuss] refresh file layout error<br>
<br>
Martin might know about that short read thing, since his site has a nice wiki page on it:<br>
<a href="https://wickie.hlrs.de/platforms/index.php/Lustre_short_read" rel="noreferrer" target="_blank">https://wickie.hlrs.de/<wbr>platforms/index.php/Lustre_<wbr>short_read</a><br>
<br>
Technically Lustre is allowed to return fewer bytes than requested, as it says on that page.  But it doesn't normally - LU-6389 is a bug where that can happen kind of often.  (Again, it's technically allowed as that page says...  But it shouldn't really happen in practice, which is why LU-6389 is a bug.)<br>
<br>
So perhaps Gaussian does not retry short reads?  If memory serves, it's closed source, so you can't check - but perhaps you could ask the vendor?<br>
______________________________<wbr>__________<br>
From: lustre-discuss [<a href="mailto:lustre-discuss-bounces@lists.lustre.org">lustre-discuss-bounces@lists.<wbr>lustre.org</a>] on behalf of Martin Hecht [<a href="mailto:hecht@hlrs.de">hecht@hlrs.de</a>]<br>
Sent: Friday, September 04, 2015 8:53 AM<br>
To: E.S. Rosenberg; Wahl, Edward<br>
Cc: <a href="mailto:lustre-discuss@lists.lustre.org">lustre-discuss@lists.lustre.<wbr>org</a><br>
Subject: Re: [lustre-discuss] refresh file layout error<br>
<br>
On 09/03/2015 07:22 AM, E.S. Rosenberg wrote:<br>
> On Wed, Sep 2, 2015 at 8:47 PM, Wahl, Edward <<a href="mailto:ewahl@osc.edu">ewahl@osc.edu</a>> wrote:<br>
><br>
>> That would be my guess here.  Any chance this is across NFS?  Seen that a<br>
>> great deal with this error, it used to cause crashes.<br>
>><br>
> Strictly speaking it is not, but it may be because a part of the path the<br>
> server 'sees'/'knows' is a symlink to the lustre filesystem which lives on<br>
> nfs...<br>
><br>
Ah, I can remember a problem we had some years ago, when users with<br>
their $HOME on NFS were accessing many files in directories on lustre<br>
via symlink. Somehow the NAS box serving the nfs file system didn't<br>
immediately notice that the files weren't on its own file system and<br>
repeatedly had to look up in its cache, just to notice that the files<br>
are somewhere else behind a symlink. If I recall correctly, the problem<br>
could be avoided by:<br>
- Either access the file via absolute path, or cd into the directory<br>
(both via mount point, not (!) via symlink)<br>
- Or make the symlink an absolute one (I'm not 100% sure, but I believe<br>
the problem was only with relative links pointing out of the NFS upwards<br>
across the mountpoint and down again into the lustre file system).<br>
It could be something similar here. Do you have any chance to access the<br>
files via absolute path in your setup and web server configuration?<br>
<br>
best regards, Martin<br>
<br>
</div></div><div class="HOEnZb"><div class="h5">______________________________<wbr>_________________<br>
lustre-discuss mailing list<br>
<a href="mailto:lustre-discuss@lists.lustre.org">lustre-discuss@lists.lustre.<wbr>org</a><br>
<a href="http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org" rel="noreferrer" target="_blank">http://lists.lustre.org/<wbr>listinfo.cgi/lustre-discuss-<wbr>lustre.org</a><br>
</div></div></blockquote></div><br></div>