중복 값을 기준으로 목록 병합

Question 1

Awk해결책:

awk '{ 
         if (NF == 2) {
             if ($1 in r) { 
                 a[r[$1]] = a[r[$1]] OFS $2; next 
             } 
             a[$1] = $2; r[$2] = $1; 
         } 
         else a[$1]; 
     }
     END{ for (i in a) print i, a[i]  }' file

NF == 2- 2개의 필드가 있는 레코드를 나타내는 조건( NF- 총 필드 수)
a- 원래 파일 이름과 이름이 바뀐 버전 사이의 합계 또는 관계와 같은 "독립형" 파일 이름(이름이 바뀌지 않은)을 포함하는 배열( b예:)da -> f
r- 역관계 "이름이 변경된 파일 이름" -> "초기 파일 이름"을 포함하는 배열(예 f -> a: )

산출:

a f z
b 
c e
d

일부 파일 이름을 여러 번 바꿀 수 있는 경우 다음 확장 솔루션을 사용하십시오.

awk '{ 
         if (NF == 2) {
             if ($1 in r) { 
                 a[r[$1]] = a[r[$1]] OFS $2; r[$2] = r[$1];
             } 
             else { a[$1] = $2; r[$2] = $1 } 
         } 
         else a[$1]; 
     }
     END{ for (i in a) print i, a[i]  }' file

Answer

Awk해결책:

awk '{ 
         if (NF == 2) {
             if ($1 in r) { 
                 a[r[$1]] = a[r[$1]] OFS $2; next 
             } 
             a[$1] = $2; r[$2] = $1; 
         } 
         else a[$1]; 
     }
     END{ for (i in a) print i, a[i]  }' file

NF == 2- 2개의 필드가 있는 레코드를 나타내는 조건( NF- 총 필드 수)
a- 원래 파일 이름과 이름이 바뀐 버전 사이의 합계 또는 관계와 같은 "독립형" 파일 이름(이름이 바뀌지 않은)을 포함하는 배열( b예:)da -> f
r- 역관계 "이름이 변경된 파일 이름" -> "초기 파일 이름"을 포함하는 배열(예 f -> a: )

산출:

a f z
b 
c e
d

일부 파일 이름을 여러 번 바꿀 수 있는 경우 다음 확장 솔루션을 사용하십시오.

awk '{ 
         if (NF == 2) {
             if ($1 in r) { 
                 a[r[$1]] = a[r[$1]] OFS $2; r[$2] = r[$1];
             } 
             else { a[$1] = $2; r[$2] = $1 } 
         } 
         else a[$1]; 
     }
     END{ for (i in a) print i, a[i]  }' file

Question 2

gawk '
{
    arr[cnt][0] = $1    
    arr[cnt++][1] = $2  
}
END {
    for(i = 0; i < cnt; i++) {
        if(!arr[i][0]) continue

        next_name = arr[i][0]

        for(j = i; j < cnt; j++) {
            if(arr[j][0] != next_name) continue

            if(arr[j][1]) {
                next_name = arr[j][1]
                delete arr[j]
            }
            printf "%s ", next_name

        }
        print ""
    }
}' cnt=0 input.txt

입력하다(테스트가 복잡함)

u
a
a f
b
c
c e
d
c
f g
g a
a i
i j
a
a z
z w

산출

u 
a f g a i j 
b 
c e 
d 
c 
a z w

Answer

gawk '
{
    arr[cnt][0] = $1    
    arr[cnt++][1] = $2  
}
END {
    for(i = 0; i < cnt; i++) {
        if(!arr[i][0]) continue

        next_name = arr[i][0]

        for(j = i; j < cnt; j++) {
            if(arr[j][0] != next_name) continue

            if(arr[j][1]) {
                next_name = arr[j][1]
                delete arr[j]
            }
            printf "%s ", next_name

        }
        print ""
    }
}' cnt=0 input.txt

입력하다(테스트가 복잡함)

u
a
a f
b
c
c e
d
c
f g
g a
a i
i j
a
a z
z w

산출

u 
a f g a i j 
b 
c e 
d 
c 
a z w

중복 값을 기준으로 목록 병합

답변1

답변2

관련 정보