<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif;">
<div>
<div>
<div>Robert</div>
<div><br>
</div>
<div>It’s LUG week this week so people may not be keeping up with the mailing lists as closely as usual. I suggest that you open a JIRA ticket about this issue so someone can investigate.</div>
<div><br>
</div>
<div>Peter</div>
<div>
<div id="MAC_OUTLOOK_SIGNATURE"></div>
</div>
</div>
</div>
<div><br>
</div>
<span id="OLK_SRC_BODY_SECTION">
<div>
<div>On 2018-04-25, 11:28 PM, "lustre-discuss on behalf of Robert Redl" <<a href="mailto:lustre-discuss-bounces@lists.lustre.org">lustre-discuss-bounces@lists.lustre.org</a> on behalf of
<a href="mailto:robert.redl@lmu.de">robert.redl@lmu.de</a>> wrote:</div>
</div>
<div><br>
</div>
<blockquote id="MAC_OUTLOOK_ATTRIBUTION_BLOCKQUOTE" style="BORDER-LEFT: #b5c4df 5 solid; PADDING:0 0 0 5; MARGIN:0 0 0 5;">
<div>
<div text="#000000" bgcolor="#FFFFFF">
<p>Good morning!</p>
<p>as there was no reaction, I try to change my question: Is anyone already using 2.11.0 with ZFS and snapshots successfully?<br>
</p>
My problem was temporally solved by downgrading the servers to 2.10.3. Snapshots are now working again as expected and can be mounted without any problems.
<br>
<br>
Best regards,<br>
Robert<br>
<br>
<div class="moz-cite-prefix">On 04/19/2018 04:26 PM, Robert Redl wrote:<br>
</div>
<blockquote type="cite" cite="mid:463578c1-3efa-80c5-5a6f-04533d589bc0@lmu.de">
<pre wrap="">Dear All,

today, I updated from Lustre 2.10.3 to 2.11.0 (on centos 7.4). The
update is now finished on all servers and everything seems to work fine.
However, when I try to mount a snapshot (we use the ZFS-backend), this
results immediately in a crash of all servers:

Apr 19 16:02:45 server1 kernel: Lustre: 58ffd1e-MDT0000: set dev_rdonly
on this device
Apr 19 16:02:45 server1 kernel: LustreError:
14660:0:(lu_object.c:1178:lu_device_fini()) ASSERTION(
atomic_read(&d->ld_ref) == 0 ) failed: Refcount is 1
Apr 19 16:02:45 server1 kernel: LustreError:
14660:0:(lu_object.c:1178:lu_device_fini()) LBUG
Apr 19 16:02:45 server1 kernel: Pid: 14660, comm: mount.lustre
Apr 19 16:02:45 server1 kernel:
                                                                    
Call Trace:
Apr 19 16:02:45 server1 kernel:  [<ffffffffc06557ae>]
libcfs_call_trace+0x4e/0x60 [libcfs]
Apr 19 16:02:45 server1 kernel:  [<ffffffffc065583c>]
lbug_with_loc+0x4c/0xb0 [libcfs]
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b5502b>]
lu_device_fini+0xbb/0xc0 [obdclass]

Message from syslogd@met-ha-filer05a at Apr 19 16:02:45 ...
 kernel:LustreError: 14660:0:(lu_object.c:1178:lu_device_fini())
ASSERTION( atomic_read(&d->ld_ref) == 0 ) failed: Refcount is 1
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b59fae>]
dt_device_fini+0xe/0x10 [obdclass]
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0da2ea8>]
osd_device_alloc+0x278/0x3b0 [osd_zfs]
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b43f7a>]
obd_setup+0x11a/0x2b0 [obdclass]

Message from syslogd@met-ha-filer05a at Apr 19 16:02:45 ...
 kernel:LustreError: 14660:0:(lu_object.c:1178:lu_device_fini()) LBUG
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b443b8>]
class_setup+0x2a8/0x840 [obdclass]
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b4882c>]
class_process_config+0x1b5c/0x2810 [obdclass]
Apr 19 16:02:45 server1 kernel:  [<ffffffff81333563>] ?
number.isra.2+0x323/0x360
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b4c738>]
do_lcfg+0x258/0x500 [obdclass]
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b50f88>]
lustre_start_simple+0x88/0x210 [obdclass]
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b7dfba>]
server_fill_super+0xf3a/0x1860 [obdclass]
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0660e27>] ?
libcfs_debug_msg+0x57/0x80 [libcfs]
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b54228>]
lustre_fill_super+0x328/0x950 [obdclass]
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b53f00>] ?
lustre_fill_super+0x0/0x950 [obdclass]
Apr 19 16:02:45 server1 kernel:  [<ffffffff8120948f>] mount_nodev+0x4f/0xb0
Apr 19 16:02:45 server1 kernel:  [<ffffffffc0b4c148>]
lustre_mount+0x38/0x60 [obdclass]
Apr 19 16:02:45 server1 kernel:  [<ffffffff81209f1e>] mount_fs+0x3e/0x1b0
Apr 19 16:02:45 server1 kernel:  [<ffffffff81226d57>]
vfs_kern_mount+0x67/0x110
Apr 19 16:02:45 server1 kernel:  [<ffffffff81229263>] do_mount+0x233/0xaf0
Apr 19 16:02:45 server1 kernel:  [<ffffffff8118bb0e>] ?
__get_free_pages+0xe/0x40
Apr 19 16:02:45 server1 kernel:  [<ffffffff81229ea6>] SyS_mount+0x96/0xf0
Apr 19 16:02:45 server1 kernel:  [<ffffffff816c0715>]
system_call_fastpath+0x1c/0x21
Apr 19 16:02:45 server1 kernel:
Apr 19 16:02:45 server1 kernel: Kernel panic - not syncing: LBUG



I'm posting this here as I don't have an account for the actual bug tracker.
Has someone experienced a similar issue?

Best regards
Robert

</pre>
</blockquote>
<br>
<div class="moz-signature">-- <br>
<p style="color:#808080;font-size:smaller">Dr. Robert Redl geb. Schuster<br>
Scientific Programmer, "Waves to Weather" (SFB/TRR165)<br>
Meteorologisches Institut<br>
Ludwig-Maximilians-Universität München<br>
Theresienstr. 37, 80333 München, Germany<br>
Tel.: +49 89 2180 4569 </p>
</div>
</div>
</div>
</blockquote>
</span>
</body>
</html>