유사한 형식의 csv 파일 간의 평균 및 표준 편차를 계산하고 해당 형식에 따라 다른 파일로 출력합니다.

유사한 형식의 csv 파일 간의 평균 및 표준 편차를 계산하고 해당 형식에 따라 다른 파일로 출력합니다.

시뮬레이션 반복으로 인한 출력 CSV 파일 세트가 있습니다. 파일의 각 파일 행은 동일한 형식(세대, 번호, 값1, 값2, ... 값X)을 따릅니다. (파일에는 동일한 순서로 헤더도 포함되어 있습니다.

각 파일의 각 셀 사이의 평균과 표준 편차를 계산하고 평균이 원본 파일과 동일한 셀/위치에 있는 다른 csv 파일을 출력하고 싶습니다. stdev는 동일한 셀/위치의 다른 파일에 있거나 모든 셀 뒤에 있을 수 있습니다.

세대, number_mean, value1_mean, value2_mean,..., valueX_mean, value1_stdev, value2_stdev,..., valueX_stdev

이를 수행하는 좋은 방법은 무엇입니까?

출력 csv 파일이 입력 파일과 동일한 형식을 따르는 것이 매우 중요합니다.

매우 감사합니다.

답변1

당신은 그것을 사용할 수 있습니다밀러.

의 예에서

a,v1,v2,v3
a,25,56,23
b,58,56,23

넌 달릴 수 있어merge-fields

mlr --csv merge-fields -a mean,stddev -r "v[0-9]" -o "result" -k input.csv >output.csv

가지다

v1 v2 v3 결과_평균 결과_stddev
25 56 이십 삼 34.666667 18.502252
두번째 58 56 이십 삼 45.666667 19.655364

관련 정보