Hi,<br><br>This is a known bug that is fixed in 1.8.2<br><br><a href="https://bugzilla.lustre.org/show_bug.cgi?id=21420">https://bugzilla.lustre.org/show_bug.cgi?id=21420</a><br><br>Best regards<br><br>Wojciech<br><br><div class="gmail_quote">
On 23 April 2010 13:18, Christopher Huhn <span dir="ltr"><<a href="mailto:C.Huhn@gsi.de">C.Huhn@gsi.de</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Dear lustre wizards,<br>
<br>
we are experiencing problems on our MDS and our Lustre expert is abroad<br>
(he just attended LUG meeting).<br>
<br>
One of the symptoms we observe are reproducible kernel oopses when<br>
viewing some stats files beneath /proc/fs/lustre/mgs/MGS/exports :<br>
<br>
    mds:~# cat /proc/fs/lustre/mgs/MGS/exports/10.12...@tcp/stats<br>
    Killed<br>
    mds:~#  mds kernel: Oops: 0000 [38] SMP<br>
    Apr 23 13:23:19 mds kernel: Unable to handle kernel paging request<br>
    at ffffffff00040024 RIP:<br>
    Apr 23 13:23:19 mds kernel: [<ffffffff883d6680>]<br>
    :obdclass:lprocfs_stats_seq_show+0x80/0x1e0<br>
    Apr 23 13:23:19 mds kernel: PGD 203067 PUD 0<br>
    Apr 23 13:23:19 mds kernel: Oops: 0000 [38] SMP<br>
    Apr 23 13:23:20 mds kernel: CPU 7<br>
    Apr 23 13:23:20 mds kernel: Modules linked in: mds fsfilt_ldiskfs(F)<br>
    mgs mgc ldiskfs crc16 lustre lov mdc lquota osc ksocklnd ptlrpc<br>
    obdclass lnet lvfs libcfs xt_tcpudp iptable_filter ip_tables<br>
    x_tables drbd cn button ac battery bonding xfs ipmi_si ipmi_devintf<br>
    ipmi_msghandler serio_raw psmouse joydev pcspkr i2c_i801 i2c_core<br>
    shpchp pci_hotplug evdev parport_pc parport ext3 jbd mbcache<br>
    dm_mirror dm_snapshot dm_mod raid10 raid456 xor raid1 raid0<br>
    multipath linear md_mod sd_mod ide_cd cdrom ata_generic libata<br>
    generic usbhid hid piix 3w_9xxx floppy ide_core ehci_hcd uhci_hcd<br>
    e1000 scsi_mod thermal processor fan<br>
    Apr 23 13:23:20 mds kernel: Pid: 7293, comm: cat Tainted: GF<br>
    2.6.22+lustre1.6.7.2+0.credativ.etch.1 #2<br>
    Apr 23 13:23:20 mds kernel: RIP: 0010:[<ffffffff883d6680>]<br>
    [<ffffffff883d6680>] :obdclass:lprocfs_stats_seq_show+0x80/0x1e0<br>
    Apr 23 13:23:20 mds kernel: RSP: 0018:ffff8103ba5f9e48  EFLAGS: 00010282<br>
    Apr 23 13:23:20 mds kernel: RAX: ffffffff00040004 RBX:<br>
    7fffffffffffffff RCX: 0000000000000006<br>
    Apr 23 13:23:20 mds kernel: RDX: 0101010101010101 RSI:<br>
    0000000000000000 RDI: 0000000000000000<br>
    Apr 23 13:23:20 mds kernel: RBP: 0000000000000000 R08:<br>
    0000000000000008 R09: 0000000000000000<br>
    Apr 23 13:23:20 mds kernel: R10: 0000000000000000 R11:<br>
    0000000000000000 R12: 0000000000000000<br>
    Apr 23 13:23:20 mds kernel: R13: 0000000000000000 R14:<br>
    0000000000000000 R15: ffff8108000a1760<br>
    Apr 23 13:23:20 mds kernel: FS:  00002b4a366786d0(0000)<br>
    GS:ffff81081004b840(0000) knlGS:0000000000000000<br>
    Apr 23 13:23:20 mds kernel: CS:  0010 DS: 0000 ES: 0000 CR0:<br>
    000000008005003b<br>
    Apr 23 13:23:20 mds kernel: CR2: ffffffff00040024 CR3:<br>
    000000078f018000 CR4: 00000000000006e0<br>
    Apr 23 13:23:20 mds kernel: Process cat (pid: 7293, threadinfo<br>
    ffff8103ba5f8000, task ffff8107dc299530)<br>
    Apr 23 13:23:20 mds kernel: Stack:  0000000000000202<br>
    ffffffff00000000 ffffffff00040004 ffff81067dae2640<br>
    Apr 23 13:23:20 mds kernel: 000000004bd18327 00000000000ca54d<br>
    0000000000000000 ffff81067dae2640<br>
    Apr 23 13:23:20 mds kernel: ffffffff00040004 0000000000040004<br>
    0000000000000400 0000000000000000<br>
    Apr 23 13:23:20 mds kernel: Call Trace:<br>
    Apr 23 13:23:20 mds kernel: [<ffffffff8029c0ac>] seq_read+0x105/0x28d<br>
    Apr 23 13:23:20 mds kernel: [<ffffffff80283f23>] vfs_read+0xcb/0x153<br>
    Apr 23 13:23:20 mds kernel: [<ffffffff802842bf>] sys_read+0x45/0x6e<br>
    Apr 23 13:23:20 mds kernel: [<ffffffff80209d8e>] system_call+0x7e/0x83<br>
    Apr 23 13:23:20 mds kernel:<br>
    Apr 23 13:23:20 mds kernel:<br>
    Apr 23 13:23:20 mds kernel: Code: 48 8b 50 20 48 8b 48 28 4c 03 60<br>
    10 4c 03 68 18 48 39 d3 48<br>
    Apr 23 13:23:20 mds kernel: RIP  [<ffffffff883d6680>]<br>
    :obdclass:lprocfs_stats_seq_show+0x80/0x1e0<br>
     mds kernel: CR2: ffffffff00040024<br>
    Apr 23 13:23:20 mds kernel: RSP <ffff8103ba5f9e48><br>
    Apr 23 13:23:20 mds kernel: CR2: ffffffff00040024<br>
<br>
<br>
Server and affected client both run Lustre 1.6.7.2 on Debian Etch/x86_64<br>
in this case. The behavior does not change after a client reboot.<br>
<br>
All hints on how to solve this are really appreciated.<br>
<br>
Kind regards,<br>
    Christopher<br>
<br>
--<br>
Christopher Huhn<br>
Linux therapist<br>
<br>
GSI Helmholtzzentrum fuer Schwerionenforschung GmbH<br>
Planckstr. 1<br>
64291 Darmstadt<br>
<a href="http://www.gsi.de/" target="_blank">http://www.gsi.de/</a><br>
<br>
Gesellschaft mit beschraenkter Haftung<br>
<br>
Sitz der Gesellschaft / Registered Office:                    Darmstadt<br>
Handelsregister       / Commercial Register:<br>
                                        Amtsgericht Darmstadt, HRB 1528<br>
<br>
Geschaeftsfuehrung    / Managing Directors:<br>
                                 Professor Dr. Dr. h.c. Horst Stoecker,<br>
                                                    Christiane Neumann,<br>
                                                   Dr. Hartmut Eickhoff<br>
Vorsitzende des Aufsichtsrates / Supervisory Board Chair:<br>
                                           Dr. Beatrix Vierkorn-Rudolph<br>
Stellvertreter        / Deputy Chair:                 Dr. Rolf Bernhard<br>
<br>
<br>
_______________________________________________<br>
Lustre-discuss mailing list<br>
<a href="mailto:Lustre-discuss@lists.lustre.org">Lustre-discuss@lists.lustre.org</a><br>
<a href="http://lists.lustre.org/mailman/listinfo/lustre-discuss" target="_blank">http://lists.lustre.org/mailman/listinfo/lustre-discuss</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>--<br>Wojciech Turek<br><br>Assistant System Manager<br><br>High Performance Computing Service<br>University of Cambridge<br>Email: <a href="mailto:wjt27@cam.ac.uk">wjt27@cam.ac.uk</a><br>
Tel: (+)44 1223 763517 <br>