Andreas,<br><br>Yes, these I/O errors are for any NFS filesystems mounted on all lustre clients.  Even though this nfs mount has nothing to do with lustre there seems to be something specific on the lustre clients with the kernel-ib and lustre client modules installed that seems to be causing this problem.<br>
<br>I believe lustre caches data locally and then flushes it out on a regular basis, but don't know enough to rule lustre out.  It looks like this issue is happening every 8-10mins.  Is there something that lustre is doing on the system that might be flushing some type of a cache or might be causing this problem?  If I do a df every 5mins or so then I never see this problem.<br>
<br>I have just run out of things to try and wanted to check the lustre route as a last resort in hopes of getting more information that might help me find a permanent solution for this issue.<br><br>Any assistance/comments would be appreciated.<br>
<br>Thanks,<br>-J<br><br><div class="gmail_quote">On Sun, Aug 8, 2010 at 6:53 PM, Andreas Dilger <span dir="ltr"><<a href="mailto:andreas.dilger@oracle.com">andreas.dilger@oracle.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
<div class="im">On 2010-08-08, at 16:44, Jagga Soorma wrote:<br>
> One other piece of information.  It seems like I have found a workaround by adding a cronjob that runs every 2mins and runs a df command.  Is there some caching issue that might be caused by lustre?<br>
<br>
</div>Are the IO errors on NFS filesystems that have nothing to do with Lustre, or is this from NFS re-exporting of a Lustre filesystem?<br>
<div class="im"><br>
>> I am experiencing some weird behavior on my lustre clients.  I have worked with Novell support and they keeping pointing to lustre as the culprit for these issues.  I am getting intermittent I/O errors when running df/ls on any nfs mounts without anything being logged in syslog.  After putting nfs and rpc in debug mode by running:<br>

><br>
</div><div class="im">> I am using all supported packages/kernels for lustre and on servers without the lustre clients installed I have no issues with nfs.  Does the interval between these errors mean anything?<br>
><br>
> Any help would be greatly appreciated.<br>
><br>
</div><div class="im">> reshpc115:~ # uname -a<br>
> Linux reshpc115 2.6.27.29-0.1-default #1 SMP 2009-08-15 17:53:59 +0200 x86_64 x86_64 x86_64 GNU/Linux<br>
> reshpc115:~ # rpm -qa | grep -i lustre<br>
> lustre-client-1.8.1.1-2.6.27.29_0.1_lustre.1.8.1.1_default<br>
> lustre-client-modules-1.8.1.1-2.6.27.29_0.1_lustre.1.8.1.1_default<br>
> reshpc115:~ # rpm -qa | grep -i kernel-ib<br>
> kernel-ib-1.4.2-2.6.27.29_0.1_default<br>
<br>
<br>
</div><div><div></div><div class="h5">Cheers, Andreas<br>
--<br>
Andreas Dilger<br>
Lustre Technical Lead<br>
Oracle Corporation Canada Inc.<br>
<br>
</div></div></blockquote></div><br>