시뮬레이션 반복으로 인한 출력 CSV 파일 세트가 있습니다. 파일의 각 파일 행은 동일한 형식(세대, 번호, 값1, 값2, ... 값X)을 따릅니다. (파일에는 동일한 순서로 헤더도 포함되어 있습니다.
각 파일의 각 셀 사이의 평균과 표준 편차를 계산하고 평균이 원본 파일과 동일한 셀/위치에 있는 다른 csv 파일을 출력하고 싶습니다. stdev는 동일한 셀/위치의 다른 파일에 있거나 모든 셀 뒤에 있을 수 있습니다.
세대, number_mean, value1_mean, value2_mean,..., valueX_mean, value1_stdev, value2_stdev,..., valueX_stdev
이를 수행하는 좋은 방법은 무엇입니까?
출력 csv 파일이 입력 파일과 동일한 형식을 따르는 것이 매우 중요합니다.
매우 감사합니다.
답변1
당신은 그것을 사용할 수 있습니다밀러.
의 예에서
a,v1,v2,v3
a,25,56,23
b,58,56,23
넌 달릴 수 있어merge-fields
mlr --csv merge-fields -a mean,stddev -r "v[0-9]" -o "result" -k input.csv >output.csv
가지다
ㅏ | v1 | v2 | v3 | 결과_평균 | 결과_stddev |
---|---|---|---|---|---|
ㅏ | 25 | 56 | 이십 삼 | 34.666667 | 18.502252 |
두번째 | 58 | 56 | 이십 삼 | 45.666667 | 19.655364 |