이와 같은 두 개의 csv 파일이 있습니다.
422174,XN,20.99,2020-09-01,2022-01-20 20:20:28.613+00
421348,SB,21.99,2021-01-26,2022-01-20 20:20:28.613+00
885176,XN,41.80,2021-11-17,2022-01-20 20:20:28.613+00
881751,SB,12.81,2020-09-01,2022-01-20 20:20:28.613+00
722483,XN,67.50,2020-09-01,2022-01-20 20:20:28.613+00
두 번째 파일;
667843,XN,22.99,2020-09-01,2022-01-20 20:20:28.613+00
421348,SB,21.99,2021-01-26,2022-01-20 20:20:28.613+00
885176,XN,41.80,2021-11-17,2022-01-20 20:20:28.613+00
881751,SB,12.81,2020-09-01,2022-01-20 20:20:28.613+00
156734,XN,34.50,2020-09-01,2022-01-20 20:20:28.613+00
출력은 다음과 같아야 합니다.
667843,XN,22.99,2020-09-01,2022-01-20 20:20:28.613+00
156734,XN,34.50,2020-09-01,2022-01-20 20:20:28.613+00
awk를 사용하여 이 작업을 어떻게 수행할 수 있나요?
답변1
comm
대신 다음을 사용합니다 awk
.
comm -13 <(sort first.csv) <(sort second.csv) > difference.csv
에서 comm --help
:
-1은 열 1(FILE1과 관련된 행)을 억제합니다.
-2는 열 2를 억제합니다(FILE2 관련 행).
-3은 열 3(두 파일 모두에 나타나는 줄)을 억제합니다.