열을 기반으로 두 csv 파일 간의 차이점 비교

Question 1

awk -F "\"*;\"*" '{print $1}' file1.csv > file1   # get first column from file1.csv with awk as stream and redirect to file1 var
awk -F "\"*;\"*" '{print $1}' file2.csv > file2   # get first column from file2.csv with awk as stream and redirect to file2 var
diff -y file1 file2   # diff file1 and file2 bash vars

또는 단일 명령과 동일합니다.

diff -y <(awk -F "\"*;\"*" '{print $1}' file1.csv)  <(awk -F "\"*;\"*" '{print $1}' file2.csv)

결과:

AL.jar                              AL.jar
AR.jar                              AR.jar
BI.jar                                <
BV.jar                              BV.jar
CaseUtilities.jar                       CaseUtilities.jar
CO.jar                              CO.jar
                                  | Common.jar

Answer

awk -F "\"*;\"*" '{print $1}' file1.csv > file1   # get first column from file1.csv with awk as stream and redirect to file1 var
awk -F "\"*;\"*" '{print $1}' file2.csv > file2   # get first column from file2.csv with awk as stream and redirect to file2 var
diff -y file1 file2   # diff file1 and file2 bash vars

또는 단일 명령과 동일합니다.

diff -y <(awk -F "\"*;\"*" '{print $1}' file1.csv)  <(awk -F "\"*;\"*" '{print $1}' file2.csv)

결과:

AL.jar                              AL.jar
AR.jar                              AR.jar
BI.jar                                <
BV.jar                              BV.jar
CaseUtilities.jar                       CaseUtilities.jar
CO.jar                              CO.jar
                                  | Common.jar

Question 2

또 다른 방법은 다음을 사용하는 것입니다 join. column파일이 예제에 따라 정렬되어 있으면...

join -t\; -e "<NULL>" -a 1 -a 2 -o 1.1 1.2 2.1 2.2 file1 file2 | column -t -s\;

산출

AL.jar             d8c06ebedd7954681f34ab5c94fdc4fb  AL.jar             d8c06ebedd7954681f34ab5c94fdc4fb
AR.jar             9a553dd203d0979aa60004e19cc98c12  AR.jar             4e6e584dd852684ba21ae63990e2a1a6
BI.jar             8022f6c5f83ba040394ff0b0a0323e8e  <NULL>             <NULL>
BV.jar             f53c4a8c988aa8806b54063ebc682803  BV.jar             213d9df82095764702ef4929424a1a0c
CaseUtilities.jar  e5f653d899298f5e5d56f357b6f781c5  CaseUtilities.jar  5b787f1f3d57922bd980ebbfe9a5343e
CO.jar             b2f7a0ab6e646d6793631e5c97e05096  CO.jar             cfb994078ff4373c7e0f15de19830a3d
<NULL>             <NULL>                            Common.jar         a09b520288870aa3888194ce59179dbd

join기본 동작은 첫 번째 필드를 연결하는 것이므로 -t\;두 파일의 모든 불일치를 포함하도록 구분 기호를 설정 -a 1 -a 2하고 빈 필드를 채운 -e "<NULL>"다음 출력 필드를 지정하면 됩니다 -o .......

join출력에는 동일한 구분 기호가 있으므로 column -t파이프를 통해 동일한 구분 기호를 사용하여 인쇄 형식을 지정합니다.

출력은 덜 정확하지만 입력 횟수는 적습니다...

Answer