파일에 NULL 값이 모두 포함된 열을 표시하지 않는 방법

Question 1

의 도움으로GNU 유틸리티datamash, 먼저 행을 뒤집은 다음 모든 빈 행을 제거하고 다시 행을 뒤집습니다.

$ datamash transpose | sed -Ee '/^(NULL\t)*NULL$/d' | datamash transpose

Answer

의 도움으로GNU 유틸리티datamash, 먼저 행을 뒤집은 다음 모든 빈 행을 제거하고 다시 행을 뒤집습니다.

$ datamash transpose | sed -Ee '/^(NULL\t)*NULL$/d' | datamash transpose

Question 2

나는 이 솔루션이 별로 마음에 들지 않지만 작동하는 것 같습니다.

#!/bin/bash

input=~/tmp/input
skip=()

c=$(awk '{print NF;exit}' "$input")

for ((i=1;i<=c;i++)); do
    col=$(awk -v c="$i" '{print $c}' "$input" | sort -u)
    if [[ $col == NULL ]]; then
        skip+=( "$i" )
    fi
done
( IFS=,; awk -v S="${skip[*]}" '{ split(S,s,","); for (i=1;i<=length(s);i++) { $s[i]="" } print}' "$input" )

input(입력 파일)
skip(나중에 채워질 배열)
c(파일의 열 수로 설정됩니다. 이는 파일 전체의 열 수가 균일하다고 가정합니다.)
이제 파일의 각 열을 반복하여 정렬하고 고유한 다음 해당 열에 .만 포함되어 있는지 확인합니다 NULL. 그렇다면 해당 열 번호를 skip배열 에 추가합니다.
이제 쉼표로 설정하고 IFS(이것이 제가 서브쉘을 사용하는 이유입니다) skip배열을 쉼표로 구분된 값으로 awk변수에 전달합니다. 이를 사용하여 split해당 변수를 다시 배열로 변환 할 수 있습니다 awk.
awks그런 다음 배열의 각 숫자를 반복 하고 열을 비우도록 설정한 후 나머지를 인쇄합니다.

Answer

나는 이 솔루션이 별로 마음에 들지 않지만 작동하는 것 같습니다.

#!/bin/bash

input=~/tmp/input
skip=()

c=$(awk '{print NF;exit}' "$input")

for ((i=1;i<=c;i++)); do
    col=$(awk -v c="$i" '{print $c}' "$input" | sort -u)
    if [[ $col == NULL ]]; then
        skip+=( "$i" )
    fi
done
( IFS=,; awk -v S="${skip[*]}" '{ split(S,s,","); for (i=1;i<=length(s);i++) { $s[i]="" } print}' "$input" )

input(입력 파일)
skip(나중에 채워질 배열)
c(파일의 열 수로 설정됩니다. 이는 파일 전체의 열 수가 균일하다고 가정합니다.)
이제 파일의 각 열을 반복하여 정렬하고 고유한 다음 해당 열에 .만 포함되어 있는지 확인합니다 NULL. 그렇다면 해당 열 번호를 skip배열 에 추가합니다.
이제 쉼표로 설정하고 IFS(이것이 제가 서브쉘을 사용하는 이유입니다) skip배열을 쉼표로 구분된 값으로 awk변수에 전달합니다. 이를 사용하여 split해당 변수를 다시 배열로 변환 할 수 있습니다 awk.
awks그런 다음 배열의 각 숫자를 반복 하고 열을 비우도록 설정한 후 나머지를 인쇄합니다.

Question 3

파일을 두 번 처리하지 않고서는 이 작업을 수행할 수 없습니다. 먼저 다음 을 사용하여 awk최종 cut명령을 빌드합니다.

killnulls(){
    cut -f "$(awk -F'\t' '
        { for(i=1;i<=NF;i++) a[i] += $i!="NULL" }
        END { for(i=1;i in a;i++) if(a[i]) printf j++?","i:i }
    ' "$@")" "$@"
}

$ killnulls file
1000    NULL    2
7       1000    2
7       1000    2
...

Answer

파일을 두 번 처리하지 않고서는 이 작업을 수행할 수 없습니다. 먼저 다음 을 사용하여 awk최종 cut명령을 빌드합니다.

killnulls(){
    cut -f "$(awk -F'\t' '
        { for(i=1;i<=NF;i++) a[i] += $i!="NULL" }
        END { for(i=1;i in a;i++) if(a[i]) printf j++?","i:i }
    ' "$@")" "$@"
}

$ killnulls file
1000    NULL    2
7       1000    2
7       1000    2
...

Question 4

주문하다:

awk '/NULL/{gsub(/NULL/,"",$0);print $0}' filename| sed -r "s/\s+/ /g"| awk 'NR==1{$3=$2;$2="NULL";}1'

산출

awk '/NULL/{gsub(/NULL/,"",$0);print $0}' i.txt| sed -r "s/\s+/ /g"| awk 'NR==1{$3=$2;$2="NULL";}1'
1000 NULL 2
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2

Answer

주문하다:

awk '/NULL/{gsub(/NULL/,"",$0);print $0}' filename| sed -r "s/\s+/ /g"| awk 'NR==1{$3=$2;$2="NULL";}1'

산출

awk '/NULL/{gsub(/NULL/,"",$0);print $0}' i.txt| sed -r "s/\s+/ /g"| awk 'NR==1{$3=$2;$2="NULL";}1'
1000 NULL 2
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2 
7 1000 2

파일에 NULL 값이 모두 포함된 열을 표시하지 않는 방법

답변1

답변2

답변3

답변4

관련 정보