<html><head>
<meta http-equiv="Content-Type" content="text/html; charset=big5">
<meta name="Generator" content="Microsoft Exchange Server">
<!-- converted from text -->
<style><!-- .EmailQuote { margin-left: 1pt; padding-left: 4pt; border-left: #800000 2px solid; } --></style></head>
<body>
<body><div>You may try recover options(rarely help) from "zpool import" but rebuilding the zpool has huge possibilities.</div><div><br></div><div>Thanks.</div><div><br></div><div>Fred<br><br><div class="acompli_signature"><br></div><br></div><br><br><br><div class="gmail_quote">On Fri, Mar 11, 2016 at 5:19 PM -0800, "Bob Ball" <span dir="ltr"><<a href="mailto:ball@umich.edu" target="_blank">ball@umich.edu</a>></span> wrote:<br><br></div></body>
<font size="2"><div class="PlainText">Hi, we have Lustre 2.7.58 in place on our OST and MDT/MGS (combined).  <br>
Underlying the lustre file system is a raid-z2 zfs pool.<br>
<br>
A few days ago, we lost 2 disks at once from the raid-z2.  I replaced <br>
one and a resilver started, that seemed to choke.  So, I put back both <br>
disks with replacements, and the new re-silver shows the following now.<br>
<br>
[root@umdist03 ~]# zpool status -v ost-007<br>
   pool: ost-007<br>
  state: DEGRADED<br>
status: One or more devices has experienced an error resulting in data<br>
         corruption.  Applications may be affected.<br>
action: Restore the file in question if possible.  Otherwise restore the<br>
         entire pool from backup.<br>
    see: <a href="http://zfsonlinux.org/msg/ZFS-8000-8A">http://zfsonlinux.org/msg/ZFS-8000-8A</a><br>
   scan: resilvered 972G in 9h25m with 1 errors on Fri Mar 11 19:12:37 2016<br>
config:<br>
<br>
         NAME                                  STATE     READ WRITE CKSUM<br>
         ost-007                               DEGRADED     0 0     1<br>
           raidz2-0                            DEGRADED     0 0     4<br>
             replacing-0                       DEGRADED     0 0     0<br>
               18280868502819750645            UNAVAIL      0 0     0  <br>
was /dev/disk/by-path/pci-0000:0c:00.0-scsi-0:2:20:0-part1/old<br>
               pci-0000:0c:00.0-scsi-0:2:20:0  ONLINE       0 0     0<br>
             pci-0000:0c:00.0-scsi-0:2:21:0    ONLINE       0 0     0<br>
             pci-0000:0c:00.0-scsi-0:2:22:0    ONLINE       0 0     0<br>
             pci-0000:0c:00.0-scsi-0:2:23:0    ONLINE       0 0     0<br>
             pci-0000:0c:00.0-scsi-0:2:24:0    ONLINE       0 0     0<br>
             pci-0000:0c:00.0-scsi-0:2:35:0    ONLINE       0 0     0<br>
             pci-0000:0c:00.0-scsi-0:2:36:0    ONLINE       1 0     0<br>
             pci-0000:0c:00.0-scsi-0:2:37:0    ONLINE       0 0     0<br>
             pci-0000:0c:00.0-scsi-0:2:38:0    ONLINE       0 0     0<br>
             replacing-9                       UNAVAIL      0 0     0<br>
               14369532488179106769            UNAVAIL      0 0     0  <br>
was /dev/disk/by-path/pci-0000:0c:00.0-scsi-0:2:39:0-part1/old<br>
               pci-0000:0c:00.0-scsi-0:2:39:0  ONLINE       0 0     0<br>
<br>
errors: Permanent errors have been detected in the following files:<br>
<br>
         ost-007/ost0030:<0x2c90f><br>
<br>
what are my options here?  If I don't care about the file, can I <br>
identify it and then just delete it?  Or is my only real option to drain <br>
the pool and rebuild it cleanly?<br>
<br>
Thanks for any help/advice.<br>
<br>
bob<br>
_______________________________________________<br>
lustre-discuss mailing list<br>
lustre-discuss@lists.lustre.org<br>
<a href="http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org">http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org</a><br>
</div></font>
</body>
</html>