<div dir="ltr">I have few questions regarding the Lustre Filesystem with 1 MDS/MDT on the same machine, 2 OSS configured with LVM created through LVM(total of 12 OSTs) and 4 Lustre Client running Hadoop(1 namenode and 3 datanode). Hadoop uses Lustre instead of HDFS.<div>
<br></div><div style>Question: I have created LVM for OSTs instead of physical hard disk? How is it going to affect my wordcount example running on 1 Namenode and 3 Datanodes. Say, if its 20 min for 18GB plain data wordcount to finish, using physical hard disk will lessen the time?</div>
<div style><br></div><div style>Question: I would like to use other dataset like wikipedia dump instead of simple wordcount. How shall I put the <a class="" target="_blank" href="http://dumps.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles.xml.bz2" style="color:rgb(85,102,221);text-decoration:none;display:inline-block;max-width:500px;overflow:hidden;padding-bottom:1px;padding-top:4px;text-overflow:ellipsis;white-space:nowrap;font-family:'Segoe UI',Tahoma,sans-serif;font-size:12px">http://dumps.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles.xml.bz2</a> into Lustre.</div>
<div style>In case of HDFS, I simply loaded into HDFS through -copyFromLocal command. Please suggest for Lustre.</div></div>