파일 1의 특정 패턴 위치를 기준으로 첫 번째 열을 기준으로 두 파일을 병합합니다.

Question 1

file1, file2 및 각 열의 의미를 안다면 더 나은 변수 이름이 나올 것입니다. 하지만 모든 Unix 시스템의 모든 쉘에서 awk를 사용하지는 않습니다.

$ cat tst.awk
BEGIN { tgt = 1402 }
NR == FNR {
    file2[$1] = $0
    next
}
{
    fld = "0000"
    val = "unknown"
    for ( i=2; i<=NF; i++ ) {
        if ( $i == tgt ) {
            fld = $i
            if ( $1 in file2 ) {
                split(file2[$1],f)
                val = f[i]
            }
            break
        }
    }
    print $1, fld, val
}

$ awk -f tst.awk file2 file1
1010089 1402 26
1010121 1402 62
1305789 1402 unknown
3456889 0000 unknown

Answer

file1, file2 및 각 열의 의미를 안다면 더 나은 변수 이름이 나올 것입니다. 하지만 모든 Unix 시스템의 모든 쉘에서 awk를 사용하지는 않습니다.

$ cat tst.awk
BEGIN { tgt = 1402 }
NR == FNR {
    file2[$1] = $0
    next
}
{
    fld = "0000"
    val = "unknown"
    for ( i=2; i<=NF; i++ ) {
        if ( $i == tgt ) {
            fld = $i
            if ( $1 in file2 ) {
                split(file2[$1],f)
                val = f[i]
            }
            break
        }
    }
    print $1, fld, val
}

$ awk -f tst.awk file2 file1
1010089 1402 26
1010121 1402 62
1305789 1402 unknown
3456889 0000 unknown

Question 2

이 시도:

  $ awk 'FNR==NR {for (ii=2;ii<=NF;ii++) if ($ii=="1402") a[$1]=ii;next} 
         {if ($1 in a) {column=a[$1]; print $1,"1402",$column}}' file1 file2
   
  1010089 1402 26
  1010121 1402 62

이 솔루션은 많은 솔루션 중 하나입니다. 매우 일반적이므로 file2첫 번째 열 값이 중복되더라도 ~300,000개의 행을 모두 처리합니다. 값 "1402"는 의 첫 번째 열 뒤의 모든 열에 배치될 수 있습니다 file1.

화타이

Answer

이 시도:

  $ awk 'FNR==NR {for (ii=2;ii<=NF;ii++) if ($ii=="1402") a[$1]=ii;next} 
         {if ($1 in a) {column=a[$1]; print $1,"1402",$column}}' file1 file2
   
  1010089 1402 26
  1010121 1402 62

이 솔루션은 많은 솔루션 중 하나입니다. 매우 일반적이므로 file2첫 번째 열 값이 중복되더라도 ~300,000개의 행을 모두 처리합니다. 값 "1402"는 의 첫 번째 열 뒤의 모든 열에 배치될 수 있습니다 file1.

화타이

파일 1의 특정 패턴 위치를 기준으로 첫 번째 열을 기준으로 두 파일을 병합합니다.

답변1

답변2

관련 정보