<div dir="ltr">Hi all<br><br>I have 4 OSS, connect by 2 Gigabit ethenet (bonding), but the system too slow<br><br>Here is log file:<br><br>LustreError: 3345:0:(ldlm_lib.c:806:target_handle_connect()) testfs-OST0002: denying connection for new client 0@lo (6d26c46a-abe5-9317-58af-72ac40318ce1): 2 clients in recovery for 271s<br>
LustreError: 3345:0:(ldlm_lib.c:1536:target_send_reply_msg()) @@@ processing error (-16)  req@ffff81006693ec00 x199/t0 o8-><?>@<?>:0/0 lens 240/144 e 0 to 0 dl 1223521394 ref 1 fl Interpret:/0/0 rc -16/0<br>
LustreError: 11-0: an error occurred while communicating with 0@lo. The ost_connect operation failed with -16<br>Lustre: 3321:0:(ldlm_lib.c:1489:target_queue_last_replay_reply()) testfs-OST0002: 1 recoverable clients remain<br>
Lustre: testfs-OST0002: sending delayed replies to recovered clients<br>Lustre: testfs-OST0002: received MDS connection from <a href="http://192.168.0.200">192.168.0.200</a>@tcp<br>Lustre: 3188:0:(import.c:395:import_select_connection()) testfs-OST0002-osc-ffff81007eeeb800: tried all connections,<b> increasing latency to 11s</b><br>
<br><br>and:<br><br>Lustre: 3196:0:(import.c:395:import_select_connection()) testfs-OST0001-osc-ffff81007ee4bc00: tried all connections, increasing latency to 31s<br>Lustre: 3196:0:(import.c:395:import_select_connection()) Skipped 2 previous similar messages<br>
LustreError: 11-0: an error occurred while communicating with <a href="http://192.168.1.202">192.168.1.202</a>@tcp. The ost_connect operation failed with -16<br>LustreError: Skipped 2 previous similar messages<br>Lustre: 3196:0:(import.c:395:import_select_connection()) testfs-OST0001-osc-ffff81007ee4bc00: tried all connections, increasing latency to 36s<br>
Lustre: 3196:0:(import.c:395:import_select_connection()) Skipped 2 previous similar messages<br>LustreError: 11-0: an error occurred while communicating with <a href="http://192.168.1.203">192.168.1.203</a>@tcp. The ost_connect operation failed with -16<br>
LustreError: Skipped 2 previous similar messages<br>Lustre: 3196:0:(import.c:395:import_select_connection()) testfs-OST0001-osc-ffff81007ee4bc00: tried all connections, increasing latency to 41s<br>Lustre: 3196:0:(import.c:395:import_select_connection()) Skipped 2 previous similar messages<br>
LustreError: 11-0: an error occurred while communicating with <a href="http://192.168.1.203">192.168.1.203</a>@tcp. The ost_connect operation failed with -16<br>LustreError: Skipped 5 previous similar messages<br>Lustre: 3196:0:(import.c:395:import_select_connection()) testfs-OST0001-osc-ffff81007ee4bc00: tried all connections, increasing latency to 51s<br>
Lustre: 3196:0:(import.c:395:import_select_connection()) Skipped 5 previous similar messages<br><br><br>Is that lustre's bug? How do I fix it?<br><br>Thanks<br><br></div>