컬럼에서 고유한 값을 추출하는 방법

Question

이렇게 하면 5줄의 코드로 필요한 작업을 수행할 수 있습니다(그 중 2줄은 정리 중입니다).

#!/bin/bash
# run this, specifying input file as $1 (parameter 1)

# delete any pre-existing column files from /tmp
find /tmp -maxdepth 1 -name "column*" -delete

# create /tmp/columnN files - each file holds one column of $1
awk '{for (f=1; f<=NF; f++) {print $f >>"/tmp/column"f}}' "$1"

# iterate through column files, sorting and removing duplicates
find /tmp -maxdepth 1 -name "column*" -execdir sort -o \{\} -u \{\} \;

# re-combine columns and output to stdout
paste /tmp/column*

# delete column files from /tmp
find /tmp -maxdepth 1 -name "column*" -delete

(현재 가지고 있는 것과 같은) 열 수가 많은 경우 /tmp/column*을 완전히 확장할 수 없기 때문에 붙여넣기 명령이 실패할 수 있습니다.

출력은 각 열의 출력이 정렬되는 반면, 원래 예제에서는 두 번째 열이 정렬되지 않는다는 점에서 예제와 다릅니다.

Answer 1

이렇게 하면 5줄의 코드로 필요한 작업을 수행할 수 있습니다(그 중 2줄은 정리 중입니다).

#!/bin/bash
# run this, specifying input file as $1 (parameter 1)

# delete any pre-existing column files from /tmp
find /tmp -maxdepth 1 -name "column*" -delete

# create /tmp/columnN files - each file holds one column of $1
awk '{for (f=1; f<=NF; f++) {print $f >>"/tmp/column"f}}' "$1"

# iterate through column files, sorting and removing duplicates
find /tmp -maxdepth 1 -name "column*" -execdir sort -o \{\} -u \{\} \;

# re-combine columns and output to stdout
paste /tmp/column*

# delete column files from /tmp
find /tmp -maxdepth 1 -name "column*" -delete

(현재 가지고 있는 것과 같은) 열 수가 많은 경우 /tmp/column*을 완전히 확장할 수 없기 때문에 붙여넣기 명령이 실패할 수 있습니다.

출력은 각 열의 출력이 정렬되는 반면, 원래 예제에서는 두 번째 열이 정렬되지 않는다는 점에서 예제와 다릅니다.

컬럼에서 고유한 값을 추출하는 방법

답변1

관련 정보