<div dir="ltr">(Maybe converting to plain text email will be more readable.)<br><br>Hi Peter and all,<br>As Kevin(on cc) and I have been working on Lustre Arm stuff for some time.<br>We want to give a status and progress report to the community and list our work plan for the next year.<br>Please help to review our work plan and give some comments and suggestions. Thanks.<br><br><br>Status and Progress<br>================<br>Release<br>-------<br>- No Arm packages built on official community release yet.<br><br>Build<br>------<br>- Verified Lustre, openZFS build and multi-nodes setup on Arm64 CentOS 8, all are ok.<br>- Lbuild script support for Arm is on review, LU-15293.<br><br>CI<br>---<br>- No Arm server end CI support yet.<br>- Arm client with x86_64 server test is already in the CI gate.<br>  - Only run a few ldiskfs test suites(sanity, sanity-sec, sanctity-lnet, etc.), not a full test.<br>  - A full test (with empty GRANT_CHECK_LIST) shows several Arm client related failed test cases, see test results page: <a href="https://testing.whamcloud.com/test_sessions?jobs=lustre-reviews&builds=82774&start_date=2021-08-26#redirect">https://testing.whamcloud.com/test_sessions?jobs=lustre-reviews&builds=82774&start_date=2021-08-26#redirect</a><br>    - sanity test 317: LU-11667 (Workaround fix landed)<br>    - sanityn test 16a: LU-11597, test 71a: LU-11787<br>    - conf-sanity test 98: LU-11785, test 112: LU-13813<br>    - sanity-flr test 50a: LU-14970<br>    - sanity-pcc test 7a: LU-14346<br><br>Arm server end test on local setup<br>---------------------------------------------<br>- Run a full ldiskfs test with all test suites.<br>  - Due to the multi MDTs crash issue, some multi MDTs tests are not run.<br>  - Many new failed tests come, see the test result google sheet for details: <a href="https://docs.google.com/spreadsheets/d/1EE5zU96_lqlkS0uk6NJeeNBrikYpd_ZEO7hdVt5spsw/edit#gid=969410610">https://docs.google.com/spreadsheets/d/1EE5zU96_lqlkS0uk6NJeeNBrikYpd_ZEO7hdVt5spsw/edit#gid=969410610</a><br>  - The openZFS full test is not run, but heard that it should be more stable than ldiskfs.<br><br>Bugfix<br>-------<br>- Old Arm always_except bugs <a href="https://jira.whamcloud.com/issues/?filter=15555">https://jira.whamcloud.com/issues/?filter=15555</a> , the Arm related ones are almost addressed.<br>  - LU-11596, LU-11597, LU-14067, LU-11787: addressed, patch sent and waiting for Arm client CI recovery to land.<br>  - LU-10073, LU-11671: can't be reproduced on Arm or happen on x86_64 also.<br><br>- Other old Arm bugs  LU-11785, LU-13813, LU-14970, LU-14346 to be fixed.<br><br>- New created server end bugs<br>  - LU-15122 : ASSERTION( iobuf->dr_rw == 0 ) crash issue, fixed patch is landed.<br>  - LU-15364: multi MDTs kernel oops issue, related to atomic unaligned memory access, work in progress.<br>  - LU-15223: 64K page size read/write improvement, long-term work, in progress.<br><br>- Full Arm related bug list with label arm: <a href="https://jira.whamcloud.com/issues/?filter=16710">https://jira.whamcloud.com/issues/?filter=16710</a><br><br>Reference to:<br>James Simmons’ Lustre Arm update: <a href="https://connect.linaro.org/resources/san19/san19-224/">https://connect.linaro.org/resources/san19/san19-224/</a><br><br><br>Work Plan<br>========<br>- Lustre Server End Critical Bug Fix target 2022-06<br>  - Lustre Multiple MDTs kernel OOPS when stripe issue: LU-15364<br>  - Lustre hangs at Sanity Test 807<br>  - Lustre Conf-sanity test 44 kernel crash<br>  - Lustre Conf sanity case 58 kernel crash<br>  - Lustre Conf sanity case 78 kernel crash<br>  - Lustre Conf sanity case 79 crash<br>  - Lustre sanity-pcc 7a case hang the cluster<br><br>- Lustre Server End Non-critical Bug Fix target 2022-12<br>  - Lustre Sanity failure cases: 33 cases<br>  - Lustre server replay-single: 1 case<br>  - Lustre sanity-flr 200 cases fix: 1 case<br>  - Lustre sanity-hsm failure cases: 25 cases<br>  - Lustre lustre-rsync-test failure test: 3 cases<br>  - Lustre recovery-small/sanity-scrub: 2 cases<br>  - Lustre sanityn test cases fix: 12 cases<br>  - Lustre sanity-lfsck failure cases fix: 3 cases<br>  - Lustre sanity-sec failure cases fix :7 cases<br>  - Lustre sanity-lnet failure cases test fix: 2 cases<br><br>- Continuous add more test suites for Arm client CI ??<br>  - Once a test suite is all passed for Arm then add it into CI.<br><br>- Server CI support for Arm on Centos8 ??<br>  - Ideally, Arm server CI can come with Arm server end fixes patches and ensure future patches merged don’t make any regressions on Arm.<br>  - As the test infra is not open source and maintained by whamcloud, it might need whamcloud to make it ??<br><br>- Other works in future<br>  - Full test with openZFS backend.<br>  - Test x86 client with Arm64 Server<br>  - Test other distros like ubuntu, SUSE etc.<br>  - Basic Optimised: CRC/AES<br>  - All-flash optimization<br><br><br>Best Regards,<br>Xinliang<br></div>