Hello, <br><br>I'm having something that I can not understand. I quite new on lustre. <br><br><br>n4 and n5 are two I/O servers, each one taking care of diferent datasets.<br><br>When one of them goes down, the other is supposed to handle the service as backup node. But n4 goes down without having heavy loads, and when n5 gets the service its cpu and memory goes to the top and performance goes to the bottom.<br>

<br>Can someone tell me which lines to look at , and from here I can start checking this issue?<br><br>Here the a 30 minutes syslog with lustre related messages from n4 : <a href="http://pastebin.com/q1iGwDxw">http://pastebin.com/q1iGwDxw</a><br>

<br>Here almost the same 30 minutes from n5. <br><a href="http://pastebin.com/4Bg5repa">http://pastebin.com/4Bg5repa</a><br><br><br>Many thanks. <br><br>Marc<br><br><br><br>