<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
Michael,
<div class="">I wasn't even aware of this behavior of falling back to jobid_name if $jobid_var is unset.  Could you please file a ticket in Jira LUDOC about this, and ideally submit a patch to explain this in the manual.</div>
<div class=""><br class="">
</div>
<div class="">Cheers, Andreas<br class="">
<div><br class="">
<blockquote type="cite" class="">
<div class="">On Aug 12, 2022, at 16:26, Sternberg, Michael G. via lustre-discuss <<a href="mailto:lustre-discuss@lists.lustre.org" class="">lustre-discuss@lists.lustre.org</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div class="">Einar,<br class="">
<br class="">
The strings in your $SLURM_JOB_ID values or host names are likely too long to serve as jobid for the Lustre Jobstats feature .<br class="">
<br class="">
You might try %H instead of %h in jobid_name. For reference, from the Lustre manual,
<a href="https://doc.lustre.org/lustre_manual.xhtml#jobstats" class="">https://doc.lustre.org/lustre_manual.xhtml#jobstats</a> :<br class="">
<br class="">
<blockquote type="cite" class="">%e print executable name<br class="">
%g print group ID number<br class="">
%h print fully-qualified hostname<br class="">
%H print short hostname<br class="">
%j print JobID from process environment variable named by the jobid_var parameter<br class="">
%p print numeric process ID<br class="">
%u print user ID number<br class="">
</blockquote>
<br class="">
<br class="">
On my system (2.12), I use:<br class="">
<br class="">
<span class="Apple-tab-span" style="white-space:pre"></span>jobid_var=PBS_JOBID<br class="">
<span class="Apple-tab-span" style="white-space:pre"></span>jobid_name=%e.%u<br class="">
<br class="">
I get job_stats by $PBS_JOBID, as expected, from processes that actually have the variable set, and synthetic %e.%u values from all others, like processes on interactive or backup nodes. This has been working just fine to pinpoint the source of occasional trouble.<br class="">
<br class="">
Curiously, I don't think the manual spells out what happens when the variable referenced by jobid_var is unset, i.e., the above fallback logic from jobid_var to jobid_name.<br class="">
<br class="">
<br class="">
With best regards,<br class="">
-- <br class="">
Michael Sternberg, Ph.D.<br class="">
Principal Scientific Computing Administrator<br class="">
Center for Nanoscale Materials<br class="">
Argonne National Laboratory<br class="">
<br class="">
<br class="">
<br class="">
<br class="">
<blockquote type="cite" class="">On Aug 12, 2022, at 03:37, Einar Næss Jensen <<a href="mailto:einar.nass.jensen@ntnu.no" class="">einar.nass.jensen@ntnu.no</a>> wrote:<br class="">
logfiles on oss servers are full of these error messages:<br class="">
Invalid jobid size (37), expect(32)<br class="">
What does it mean?<br class="">
<br class="">
we have set this:<br class="">
[root@mds-1 ~]# lctl get_param jobid_var jobid_name<br class="">
jobid_var=SLURM_JOB_ID<br class="">
jobid_name=%j:%u:%h<br class="">
<br class="">
lustre version is 2.12.6(ddn)<br class="">
</blockquote>
_______________________________________________<br class="">
lustre-discuss mailing list<br class="">
<a href="mailto:lustre-discuss@lists.lustre.org" class="">lustre-discuss@lists.lustre.org</a><br class="">
http://lists.lustre.org/listinfo.cgi/lustre-discuss-lustre.org<br class="">
</div>
</div>
</blockquote>
</div>
<br class="">
<div class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div>Cheers, Andreas</div>
<div>--</div>
<div>Andreas Dilger</div>
<div>Lustre Principal Architect</div>
<div>Whamcloud</div>
<div><br class="">
</div>
<div><br class="">
</div>
<div><br class="">
</div>
</div>
</div>
</div>
</div>
</div>
<br class="Apple-interchange-newline">
</div>
<br class="Apple-interchange-newline">
<br class="Apple-interchange-newline">
</div>
<br class="">
</div>
</body>
</html>