두 csv 파일의 차이점을 구하고 차이점을 세 번째 파일에 쓰는 방법은 무엇입니까?

2024-6-10 • tag-icon

두 csv 파일의 차이점을 구하고 차이점을 세 번째 파일에 쓰는 방법은 무엇입니까?

이와 같은 두 개의 csv 파일이 있습니다.

422174,XN,20.99,2020-09-01,2022-01-20 20:20:28.613+00
421348,SB,21.99,2021-01-26,2022-01-20 20:20:28.613+00
885176,XN,41.80,2021-11-17,2022-01-20 20:20:28.613+00
881751,SB,12.81,2020-09-01,2022-01-20 20:20:28.613+00
722483,XN,67.50,2020-09-01,2022-01-20 20:20:28.613+00

두 번째 파일;

667843,XN,22.99,2020-09-01,2022-01-20 20:20:28.613+00
421348,SB,21.99,2021-01-26,2022-01-20 20:20:28.613+00
885176,XN,41.80,2021-11-17,2022-01-20 20:20:28.613+00
881751,SB,12.81,2020-09-01,2022-01-20 20:20:28.613+00
156734,XN,34.50,2020-09-01,2022-01-20 20:20:28.613+00

출력은 다음과 같아야 합니다.

667843,XN,22.99,2020-09-01,2022-01-20 20:20:28.613+00
156734,XN,34.50,2020-09-01,2022-01-20 20:20:28.613+00

awk를 사용하여 이 작업을 어떻게 수행할 수 있나요?

답변1

comm대신 다음을 사용합니다 awk.

comm -13 <(sort first.csv) <(sort second.csv) > difference.csv

에서 comm --help:

-1은 열 1(FILE1과 관련된 행)을 억제합니다.

-2는 열 2를 억제합니다(FILE2 관련 행).

-3은 열 3(두 파일 모두에 나타나는 줄)을 억제합니다.

답변1

관련 정보