<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><br><div><div>On Jun 2, 2008, at 11:49 AM, Dennis Nelson wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"> <div> <!-- Converted from text/plain format --><div><font size="2"><br> ><br> > Unless you are getting some kind of kernel panic, that stack trace<br> > should be in the syslog.<br></font></div></div></blockquote><br></div><div><br></div><div>No, it is going down hard in a kernel panic.     All of the stack trace I can see at the moment looks like (scribbled by hand... so forgive me for leaving off the addresses and offsets).</div><div><br></div><div><br></div><div><font class="Apple-style-span" face="Courier">:libcfs:cfs_alloc</font></div><div><font class="Apple-style-span" face="Courier">:obdclass:lustre_init_lsi</font></div><div><font class="Apple-style-span" face="Courier">:obdclass:lustre_fill_super</font></div><div><font class="Apple-style-span" face="Courier">:obdclass::lustre_fill_super</font></div><div><font class="Apple-style-span" face="Courier">set_anon_super</font></div><div><font class="Apple-style-span" face="Courier">set_anon_super</font></div><div><font class="Apple-style-span" face="Courier">:obd_class:lustre_fill_super</font></div><div><font class="Apple-style-span" face="Courier">et_sb_nodev</font></div><div><font class="Apple-style-span" face="Courier">vfs_kern_mount</font></div><div><font class="Apple-style-span" face="Courier">do_kern_mount</font></div><div><font class="Apple-style-span" face="Courier">do_mount</font></div><div><font class="Apple-style-span" face="Courier">__handle_mm_fault</font></div><div><font class="Apple-style-span" face="Courier">__up_read</font></div><div><font class="Apple-style-span" face="Courier">do_page_fault</font></div><div><font class="Apple-style-span" face="Courier">zone_statistics</font></div><div><font class="Apple-style-span" face="Courier">__alloc_pages</font></div><div><font class="Apple-style-span" face="Courier">sys_mount</font></div><div><font class="Apple-style-span" face="Courier">system_call</font></div><div><font class="Apple-style-span" face="Courier"><br></font></div><div><font class="Apple-style-span" face="Courier">RIP <  .....  > resched_task</font></div><div><br></div><div><br></div><div>I wish I could get the whole trace to you.   We might try to get kdump on there but my luck with kdump has been mixed.   It seems to work with some chipsets and not with others.</div><div><br></div><div>Anyway, we may just be out of luck.   I just hate to give up too easily because it seems like everything is solid yet we crash on or just after the mount.   This is on a MDS that has been running without a problem for 5 months (lustre 1.6.4.2 ).   </div><div><br></div><div>uname -a </div><div>Linux hpcmds 2.6.18-8.1.14.el5.L-1642 #2 SMP Thu Feb 21 15:42:14 EST 2008 x86_64 x86_64 x86_64 GNU/Linux</div><div><br></div><div>I don't know if that trace is a lot of help to you since it is not complete (which is why I didn't post it initially) but maybe there is something there of use.</div><div><br></div><div>Regards,</div><div><br></div><div>Charlie Taylor</div><div>UF HPC Center</div><div><br></div><div><br></div><div><br></div><div><br></div></body></html>