다음은 우리가 가지고 있는 텍스트 파일입니다.
파일 1.txt
A B C D
4 9
5 8
파일 2.txt:
H I J K L M N O P Q R
1 2 3 5 8 9 5 3 3 2 4
4 7 8 9 5 6 8 9 0 8 7
7 8 0 7 4 7 7 9 0 6 7
2 7 9 5 7 9 0 7 6 5 4
file1.txt의 A 열이 file2.txt의 L 열과 일치하는 경우 file2.txt에서 두 개의 열(H 및 N)을 추출하고 표시할 출력 텍스트 파일은 다음과 같아야 합니다.
출력.txt
A B C D
4 9 7 7
5 8 4 8
어떻게 해야 하나요?
답변1
grep을 사용하면 불가능하지만 awk를 사용하면 가능합니다.
$ awk 'NR==1 {print $0;next} # Print header
NR==FNR {a[$1]=$2;next} # collect data from file1.txt
{ if($5 in a) # If column L match
{ print($5,a[$5],$1,$7) } # print columns (H and N)
}
' file1.txt file2.txt
한 줄로:
$ awk 'NR==1{print $0;next} NR==FNR{a[$1]=$2;next} {if($5 in a){print($5,a[$5],$1,$7)}}' file1.txt file2.txt
A B C D
5 8 4 8
4 9 7 7
순서는 필드에 나타나는 순서와 동일합니다 file2.txt
.
정렬이 필요한 경우 정렬 단계를 추가하세요.
답변2
단계별 방법으로 설명하겠습니다
파일 정렬 1
sort file1.txt > file1.sorted.txt
file2에서 흥미로운 부분을 가져와 정렬합니다.
awk '{print $5,$1,$7}' file2.txt | sort > file2_of_interest.txt
키를 기준으로 두 출력을 연결합니다(두 파일의 열 1).
join file1.sorted.txt file2_of_interest.txt -1 1 -2 1
간접 참조를 사용하여 이 세 단계를 결합할 수 있지만 궁극적으로는 최소한 하나의 파일에 대한 구문 분석을 완료해야 합니다. file2.txt의 L 열이 고유하지 않거나 file1.txt의 열 1이 고유하지 않다는 우려도 있습니다. 키를 고유하게 만드는 비즈니스 논리를 넣어 이러한 문제를 해결해야 합니다.