두 파일의 열을 결합하여 별도의 출력 파일로 분리합니다.

Question 1

예제에 따라 두 파일이 모두 정렬되어 있다고 가정하면(헤더 행 제외) 다음이 작동합니다.

column=2
until [[ $column > $(awk -F, '{ print NF; exit }' file1.csv) ]] ; do 
  join -t , -o 1.1,1.$column,2.$column file1.csv file2.csv > $(awk -F, '{ print $'$column'; exit }' file1.csv).csv 
  ((column++))
done

(조각을 빌렸습니다.@야노스존재하다이 답글.)

여기서 대부분의 마법은 join다음과 같이 수행됩니다. 출력 파일은 현재 디렉터리에 기록됩니다.

Answer

예제에 따라 두 파일이 모두 정렬되어 있다고 가정하면(헤더 행 제외) 다음이 작동합니다.

column=2
until [[ $column > $(awk -F, '{ print NF; exit }' file1.csv) ]] ; do 
  join -t , -o 1.1,1.$column,2.$column file1.csv file2.csv > $(awk -F, '{ print $'$column'; exit }' file1.csv).csv 
  ((column++))
done

(조각을 빌렸습니다.@야노스존재하다이 답글.)

여기서 대부분의 마법은 join다음과 같이 수행됩니다. 출력 파일은 현재 디렉터리에 기록됩니다.

Question 2

이는 다음과 유사합니다.미구엘 스비에라의 답변, 그러나 Bash를 사용하여 열 수를 계산하고 헤더를 가져옵니다.

IFS=, read -a headers < file1.csv
column=0
for h in "${headers[@]}"
do
        if [ "$((++column))" = 1 ]
        then
                continue
        fi
        join -t, -o "0,1.$column,2.$column" file1.csv file2.csv > "$h".csv
done

산출:

텍스트1.csv

names,text1,text1
A,1,7
B,5,3
C,3,8
D,9,1

텍스트2.csv

names,text2,test2
A,4,2
B,2,0
C,7,7
D,1,5

텍스트3.csv

names,text3,text3
A,3,9
B,8,6
C,4,2
D,3,6

노트:

read -a파일의 첫 번째 줄을 배열로 읽어옵니다.
이 column변수의 값은 1, 2, 3, 4, ...입니다. 1이면 출력 파일을 column생성하지 않기 때문에 처리되지 않습니다 .names.csv
데이터 열의 경우 를 실행하면 join첫 번째 열(기본값)을 연결하여 해당 열과 column각 파일의 숫자 열을 출력합니다. 이부분은 거의 비슷해요미구엘 스비에라의 답변.
headers배열(즉, 첫 번째 줄의 필드 )을 사용하여 file1.csv출력 파일의 이름을 지정합니다.

그리고미구엘 스비에라의 답변그리고루딕의 답변, 이것은 가정합니다

파일의 열 수가 동일합니다(이상적으로는 일치해야 함).
파일의 라인(라인) 수가 동일합니다(또한 일치해야 함).

이는 파일이 정렬된 경우 가장 잘 작동합니다(그러나 정렬되지 않은 경우에도 작동할 수 있습니다.내부에동일한주문하다). 다시 말하지만, 이 작업은 Bash에서 수행되어야 합니다.

Answer