<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif;">
<div>My initial question is what are you measuring and where are you measuring it?</div>
<div><br>
</div>
<div>There are many different layers of caching happening, possibly all at the same time.  If you're benchmarking it's much better to figure out your max sustained read/write speeds than rely on peaks.</div>
<div><br>
</div>
<div>-Ben</div>
<div><br>
</div>
<span id="OLK_SRC_BODY_SECTION">
<div style="font-family:Calibri; font-size:11pt; text-align:left; color:black; BORDER-BOTTOM: medium none; BORDER-LEFT: medium none; PADDING-BOTTOM: 0in; PADDING-LEFT: 0in; PADDING-RIGHT: 0in; BORDER-TOP: #b5c4df 1pt solid; BORDER-RIGHT: medium none; PADDING-TOP: 3pt">
<span style="font-weight:bold">From: </span>lustre-discuss <<a href="mailto:lustre-discuss-bounces@lists.lustre.org">lustre-discuss-bounces@lists.lustre.org</a>> on behalf of "E.S. Rosenberg" <<a href="mailto:esr+lustre@mail.hebrew.edu">esr+lustre@mail.hebrew.edu</a>><br>
<span style="font-weight:bold">Date: </span>Monday, February 6, 2017 at 3:25 PM<br>
<span style="font-weight:bold">To: </span>"<a href="mailto:lustre-discuss@lists.lustre.org">lustre-discuss@lists.lustre.org</a>" <<a href="mailto:lustre-discuss@lists.lustre.org">lustre-discuss@lists.lustre.org</a>><br>
<span style="font-weight:bold">Subject: </span>[lustre-discuss] Traffic compression?<br>
</div>
<div><br>
</div>
<div>
<div>
<div dir="ltr">
<div>
<div>
<div>
<div>
<div>
<div>We started closer monitoring of resources on our cluster and I noticed that there is sometimes a big discrepancy between the read traffic reported by Lustre and the incoming traffic reported by infiniband (which is the interace carrying the Lustre traffic).<br>
<br>
</div>
Currently I have a 4.4GB peak on Lustre while Infiniband at the same time is showing just 1.4GB/s traffic (also there is a 2 minute difference between the 2 peaks)<br>
This is the summation of all the nodes (without the servers) in the cluster.<br>
</div>
The stats are gathered using collectl at a 1 minute interval.<br>
</div>
<br>
</div>
Thanks,<br>
</div>
Eli<br>
<br>
</div>
(There are also lots of stats that match 1:1 which makes me less sure what to make of this)<br>
</div>
</div>
</div>
</span>
</body>
</html>