You should not have to do the lfsck if the initial fsck's come back clean.<div>cliffw</div><div><br><br><div class="gmail_quote">On Mon, Feb 7, 2011 at 1:16 PM, Joe Digilio <span dir="ltr"><<a href="mailto:jgd-lustre@metajoe.com">jgd-lustre@metajoe.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Last week we experienced a major hardware failure (disk controller)<br>
that brought down our system hard.  Now that I have the replacement<br>
controller, I want to make sure I recover correctly.  Below is the<br>
procedure I plan to follow based on what I've gathered from the<br>
Operations Manual.<br>
<br>
Any comments?<br>
Do I need to create the mds/ost DBs AFTER ll_recover_lost_found_objs?<br>
<br>
Thanks!<br>
-Joe<br>
<br>
<br>
###MDT Recovery<br>
# Capture fs state before doing anything<br>
e2fsck -vfn /dev/$MDTDEV<br>
# "safe" repair<br>
e2fsck -vfp /dev/$MDTDEV<br>
# Verify no more problems and generate mdsdb<br>
e2fsck -vfn --mdsdb /tmp/mdsdb /dev/$MDTDEV<br>
<br>
###OST Recovery<br>
foreach OST<br>
    # Capture fs state before doing anything<br>
    e2fsck -vfn /dev/$OSTDEV<br>
    # "safe" repair<br>
    e2fsck -vfp /dev/$OSTDEV<br>
    # Verify no more problems<br>
    e2fsck -vfn --mdsdb /tmp/mdsdb --ostdb /tmp/ostXdb /dev/$OSTDEV<br>
<br>
### Recover lost+found Objects<br>
foreach OST<br>
    mount -t ldiskfs /dev/$OSTDEV /mnt/ost<br>
    ll_recover_lost_found_objs -v -d /mnt/ost/lost+found<br>
<br>
### Coherency Check<br>
lfsck -n -v --mdsdb /tmp/mdsdb --ostdb<br>
/tmp/ost1db,/tmp/ost2db,...,/tmp/ostNdb /lustre<br>
_______________________________________________<br>
Lustre-discuss mailing list<br>
<a href="mailto:Lustre-discuss@lists.lustre.org">Lustre-discuss@lists.lustre.org</a><br>
<a href="http://lists.lustre.org/mailman/listinfo/lustre-discuss" target="_blank">http://lists.lustre.org/mailman/listinfo/lustre-discuss</a><br>
</blockquote></div><br></div>