더 작은 파일과 더 큰 파일 사이에서 일치하는 값과 일치하지 않는 값을 병합하여 인쇄합니다.

Question

가독성을 높이기 위해 원본 예제의 형식을 다시 지정합니다.

join -a1 -e "NoMatch" \
 <(awk -F ' ' '{print $0}' file1.txt |tail -n +2|sort -k1,1) \
 <(cat file2 | sort -k1,1)

모든 문제는 joinfile2 처리 및 옵션과 관련이 있습니다.

file2는 필드 1(필드 2여야 함)을 기준으로 정렬됩니다.
-t '<tab>'options가 없으면 joinfile2는 탭으로 구분됩니다.
joinfile2 필드 2를 결합하는 옵션이 누락되었습니다 .
file2의 필드가 정확하더라도 join기본 출력은 연결된 필드를 먼저 인쇄하므로 -o FORMAT에 옵션을 지정해야 합니다 join.
file2 헤더는 제거되지 않습니다.
문제를 일으키지는 않지만 처리가 필요하지 않습니다. 첫 번째 줄을 건너뛸 수 있으므로 tailfile1에는 필요하지 않습니다 .awk
-F ' '옵션이 필요하지 않습니다 awk.

이러한 문제를 수정하면 다음과 같은 결과가 발생합니다.

#!/bin/bash
head -1 file2
join -t '   ' -2 2 -a 1 -e NoMatch -o 2.1,2.2,2.3 \
 <(awk 'NR==1{next} {print $0}' file1.txt | sort) \
 <(tail -n +2 file2 | sort -k2)

그러면 탭으로 구분된 다음과 같은 출력이 생성됩니다.

value   ID1     ID2
1       a       aaaa1
1       a       aaaa2
1       b       bbbb1
1       b       bbbb2
1       b       bbbb3
NoMatch NoMatch NoMatch
1       d       aaaa4

Answer 1

가독성을 높이기 위해 원본 예제의 형식을 다시 지정합니다.

join -a1 -e "NoMatch" \
 <(awk -F ' ' '{print $0}' file1.txt |tail -n +2|sort -k1,1) \
 <(cat file2 | sort -k1,1)

모든 문제는 joinfile2 처리 및 옵션과 관련이 있습니다.

file2는 필드 1(필드 2여야 함)을 기준으로 정렬됩니다.
-t '<tab>'options가 없으면 joinfile2는 탭으로 구분됩니다.
joinfile2 필드 2를 결합하는 옵션이 누락되었습니다 .
file2의 필드가 정확하더라도 join기본 출력은 연결된 필드를 먼저 인쇄하므로 -o FORMAT에 옵션을 지정해야 합니다 join.
file2 헤더는 제거되지 않습니다.
문제를 일으키지는 않지만 처리가 필요하지 않습니다. 첫 번째 줄을 건너뛸 수 있으므로 tailfile1에는 필요하지 않습니다 .awk
-F ' '옵션이 필요하지 않습니다 awk.

이러한 문제를 수정하면 다음과 같은 결과가 발생합니다.

#!/bin/bash
head -1 file2
join -t '   ' -2 2 -a 1 -e NoMatch -o 2.1,2.2,2.3 \
 <(awk 'NR==1{next} {print $0}' file1.txt | sort) \
 <(tail -n +2 file2 | sort -k2)

그러면 탭으로 구분된 다음과 같은 출력이 생성됩니다.

value   ID1     ID2
1       a       aaaa1
1       a       aaaa2
1       b       bbbb1
1       b       bbbb2
1       b       bbbb3
NoMatch NoMatch NoMatch
1       d       aaaa4

더 작은 파일과 더 큰 파일 사이에서 일치하는 값과 일치하지 않는 값을 병합하여 인쇄합니다.

#

답변1

관련 정보