<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>we have come across two instances of what may be e2fsck bugs.</div><div><br></div><div>the situation comes from trying to repair some OSTs that suffered outages.</div><div>the system running is lustre-2.1.2 (latest maintenance release)</div><div>e2fstools is 1.42.3-wc3</div><div><br></div><div><br></div><div><u>case1:</u></div><div><br></div><div>e2fsck reports the following on an OST</div><div><br></div><div><div>e2fsck 1.42.3.wc3 (15-Aug-2012)</div><div>lustre-OST0001: recovering journal</div><div>Pass 1: Checking inodes, blocks, and sizes</div><div>Pass 2: Checking directory structure</div><div>Entry '5753172' in /O/0/d20 (31064071) has deleted/unused inode 6178421.  Clear? yes</div><div><br></div><div>Entry '5753173' in /O/0/d21 (31064072) has deleted/unused inode 6178422.  Clear? yes</div><div><br></div><div>Entry '5753175' in /O/0/d23 (31096834) has deleted/unused inode 6178424.  Clear? yes</div><div><br></div><div>Entry '5753174' in /O/0/d22 (31096833) has deleted/unused inode 6178423.  Clear? yes</div><div><br></div><div>Pass 3: Checking directory connectivity</div><div>Pass 4: Checking reference counts</div><div>Pass 5: Checking group summary information</div><div><br></div><div>lustre-OST0001: ***** FILE SYSTEM WAS MODIFIED *****</div><div>lustre-OST0001: 3799906/32431488 files (1.2% non-contiguous), 2863449917/8302436879 blocks</div></div><div><br></div><div>when the disk is remounted to the OSS however after a short interval the following appears</div><div><br></div><div><div>Lustre: lustre-OST0001: sending delayed replies to recovered clients</div><div>Lustre: lustre-OST0001: received MDS connection from 10.9.89.51@tcp</div><div>Lustre: Skipped 1 previous similar message</div><div>LDISKFS-fs error (device etherd!e9.0): ldiskfs_lookup: deleted inode referenced: 6178422</div><div>Aborting journal on device etherd!e9.24p2.</div><div>LDISKFS-fs (etherd!e9.0): Remounting filesystem read-only</div><div>LustreError: 14555:0:(filter.c:1506:filter_fid2dentry()) lustre-OST0001: object 5753173:0 lookup error: rc -5</div><div>LustreError: 14555:0:(filter.c:3129:__filter_oa2dentry()) filter_setattr error looking up object: 5753173:0</div><div>LustreError: 14551:0:(llog_cat.c:485:llog_cat_process_thread()) llog_cat_process() failed -5</div></div><div><br></div><div>it seems the dangling entry has not been fixed. it would appear we have no way to fix this disk in it's current state.</div><div>e2fsck will not rectify the issue. Is this a bug or a feature of a terminally damaged disk.??</div><div><br></div><div><u>case2:</u></div><div><br></div><div>e2fsck of a disk that was cleanly unmounted but came back up with errors reports some inodes with multiply claimed blocks.</div><div>however e2fsck reports the following when trying to delete them:</div><div><br></div><div><div>File /O/0/d1/4921697 (inode #14123014, mod time Wed Aug 15 10:45:12 2012) </div><div>  has 666 multiply-claimed block(s), shared with 1 file(s):</div><div>        /O/0/d11 (inode #30900230, mod time Thu Aug 16 17:49:45 2012)</div><div>Delete file? yes</div><div><br></div><div>delete_file_block: internal error: can't find dup_blk for 7910459945</div><div><br></div><div>File ??? (inode #14123015, mod time Wed Aug 15 10:27:33 2012) </div><div>  has 648 multiply-claimed block(s), shared with 1 file(s):</div><div>        /O/0/d12 (inode #30900231, mod time Thu Aug 16 17:49:45 2012)</div><div>Delete file? yes</div><div><br></div><div>delete_file_block: internal error: can't find dup_blk for 7910459968</div><div><br></div><div>File ??? (inode #14123016, mod time Wed Aug 15 10:45:12 2012) </div><div>  has 657 multiply-claimed block(s), shared with 1 file(s):</div><div>        /O/0/d13 (inode #30900232, mod time Thu Aug 16 17:49:45 2012)</div><div>Delete file? yes</div><div><br></div><div>delete_file_block: internal error: can't find dup_blk for 7910459957</div></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><br><div apple-content-edited="true">
<div style="font-size: 12px; ">Professor Samuel Aparicio BM BCh PhD FRCPath</div><div style="font-size: 12px; ">Nan and Lorraine Robertson Chair UBC/BC Cancer Agency</div><div style="font-size: 12px; ">675 West 10th, Vancouver V5Z 1L3, Canada.</div><div style="font-size: 12px; ">office: +1 604 675 8200 lab website <a href="http://molonc.bccrc.ca/">http://molonc.bccrc.ca</a></div><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div><br></div></div></span><br class="Apple-interchange-newline"></div><br class="Apple-interchange-newline"><br class="Apple-interchange-newline">
</div>
<br></body></html>