공통 패턴이지만 여러 연결로 두 파일을 결합합니다.

Question 1

awk다음 명령을 사용하여 작업을 수행 할 수 있어야 합니다 .

awk -F"\t" 'FNR==NR{if ($1 in a) {a[$1]=a[$1] ";" $5} else {a[$1]=$5}} \
            NR>FNR{split($0,f,";"); $0=$0 ";" a[f[3]]; print}' file1 file2

(가독성을 높이기 위해 두 줄로 나눕니다.)

이는 먼저 file1파일( 로 표시)을 읽고 처리할 때 동일한 값 에 해당하는 모든 값을 누적하는 FNR == NR매핑 테이블을 생성합니다 .a$5$1

두 번째 파일( NR>FNR)이 처리되고 테이블에 a세 번째 세미콜론으로 구분된 필드 값에 대한 항목이 포함되면 해당 값이 행에 추가됩니다.

"파일별 필드 구분 기호"를 지정할 수 없으므로 -F선택한 명령줄 인수는 탭으로 구분된 첫 번째 파일에 대해 정확합니다. 이는 두 번째 파일을 처리할 때 함수를 사용하여 "수동으로" 분할을 수행 하고 결과를 다른 배열에 저장한 다음 split()대신 를 통해 f해당 항목(=필드)에 액세스해야 함을 의미합니다.f[number]$number

(고쳐 쓰다나는 Stalin Vignesh Kumar의 답변에서 다음과 같이 말한 내용을 수정했습니다. 결국 파일당 필드 구분 기호를 지정할 수 있습니다. )

귀하의 예제 입력에 대해 나는 얻습니다.

fli;flo;A1;flu;flc;23;21;28
fli;flo;A2;flu;flc;
fli;flo;B1;flu;flc;
fli;flo;B2;flu;flc;32;31;35

Answer

awk다음 명령을 사용하여 작업을 수행 할 수 있어야 합니다 .

awk -F"\t" 'FNR==NR{if ($1 in a) {a[$1]=a[$1] ";" $5} else {a[$1]=$5}} \
            NR>FNR{split($0,f,";"); $0=$0 ";" a[f[3]]; print}' file1 file2

(가독성을 높이기 위해 두 줄로 나눕니다.)

이는 먼저 file1파일( 로 표시)을 읽고 처리할 때 동일한 값 에 해당하는 모든 값을 누적하는 FNR == NR매핑 테이블을 생성합니다 .a$5$1