목록은 첫 번째 필드를 기준으로 정렬됩니다. 첫 번째 필드가 동일한 행에 두 번째 필드를 추가하는 방법은 무엇입니까?

Question 1

벨트 sort+ awk파이프:

sort -k1,1 file \
| awk 'url && $1 != url{ print url, acc }
      { acc = ($1 == url? acc FS:"") $2; url = $1 }END{ print url, acc }' OFS='\t'

예제 출력:

url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

Answer

벨트 sort+ awk파이프:

sort -k1,1 file \
| awk 'url && $1 != url{ print url, acc }
      { acc = ($1 == url? acc FS:"") $2; url = $1 }END{ print url, acc }' OFS='\t'

예제 출력:

url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

Question 2

GNU 사용 datamash:

$ datamash -W -g 1 collapse 2 < input.txt
url1    acct2
url2    acct1
url3    acct1,acct2
url4    acct2,acct3,acct5

옵션:

다음을 사용하여 쉼표를 공백으로 변환할 수 있습니다 tr.

$ datamash -W -g 1 collapse 2 < input.txt | tr ',' ' '
url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

첫 번째 필드의 출력을 정렬해야 하는 경우 다음을 추가하세요 -s.

datamash -s -W -g 1 collapse 2 < input.txt | tr ',' ' '

Answer

GNU 사용 datamash:

$ datamash -W -g 1 collapse 2 < input.txt
url1    acct2
url2    acct1
url3    acct1,acct2
url4    acct2,acct3,acct5

옵션:

다음을 사용하여 쉼표를 공백으로 변환할 수 있습니다 tr.

$ datamash -W -g 1 collapse 2 < input.txt | tr ',' ' '
url1    acct2
url2    acct1
url3    acct1 acct2
url4    acct2 acct3 acct5

첫 번째 필드의 출력을 정렬해야 하는 경우 다음을 추가하세요 -s.

datamash -s -W -g 1 collapse 2 < input.txt | tr ',' ' '

관련 정보