세 파일 비교: 열 비교를 사용하여 모든 파일에 있는 줄을 비교합니다.

Question

나는 놀라운 원 히트 솔루션을 제시할 슈퍼스타들이 있다고 확신 awk하지만 여기에 큰 망치가 있습니다.

모든 파일이 열 3의 키에 맞게 정렬되어 있다고 가정합니다(그렇지 않은 경우 sort -k 3 file먼저 파일을 정렬해야 합니다).

join -j 3 2d.tsv 3d.tsv | join -1 1 -2 3 - 4d.tsv > tmp
awk '{print $2, $3, $1}' tmp > 2d_new.tsv
awk '{print $4, $5, $1}' tmp > 3d new.tsv
awk '{print $6, $7, $1}' tmp > 4d_new.tsv

마지막 3줄은 병합 가능

awk '{ print $2, $3, $1 > "2d_new.tsv"; print $4 $5, $1 > "3d_new.tsv"; print $6, $7, $1 > "4d_new.tsv" }' tmp

파일링을 피하기 위해 단일 라이너를 사용하려면 tmp다음을 |추가 하십시오.joinawk

Answer 1

나는 놀라운 원 히트 솔루션을 제시할 슈퍼스타들이 있다고 확신 awk하지만 여기에 큰 망치가 있습니다.

모든 파일이 열 3의 키에 맞게 정렬되어 있다고 가정합니다(그렇지 않은 경우 sort -k 3 file먼저 파일을 정렬해야 합니다).

join -j 3 2d.tsv 3d.tsv | join -1 1 -2 3 - 4d.tsv > tmp
awk '{print $2, $3, $1}' tmp > 2d_new.tsv
awk '{print $4, $5, $1}' tmp > 3d new.tsv
awk '{print $6, $7, $1}' tmp > 4d_new.tsv

마지막 3줄은 병합 가능

awk '{ print $2, $3, $1 > "2d_new.tsv"; print $4 $5, $1 > "3d_new.tsv"; print $6, $7, $1 > "4d_new.tsv" }' tmp

파일링을 피하기 위해 단일 라이너를 사용하려면 tmp다음을 |추가 하십시오.joinawk

세 파일 비교: 열 비교를 사용하여 모든 파일에 있는 줄을 비교합니다.

답변1

관련 정보