용어 목록이 포함된 모든 열 추출

Question 1

OP는 다음을 수행할 수 있다고 생각합니다.

헤더 읽기 data.txt및 열을 행으로 변환
Grep일치하는 숫자 행을 가져옵니다.list.txt
data.txt통과하다cut

열이 탭으로 구분된 경우 스크립트는 다음과 같습니다.

cut -f 1,$(
    head -n1 data.txt |
    tr '\t' '\n' |
    grep -nf list.txt |
    sed ':a;$!N;s/:[^\n]*\n/,/;ta;s/:.*//'
) data.txt

Answer

OP는 다음을 수행할 수 있다고 생각합니다.

헤더 읽기 data.txt및 열을 행으로 변환
Grep일치하는 숫자 행을 가져옵니다.list.txt
data.txt통과하다cut

열이 탭으로 구분된 경우 스크립트는 다음과 같습니다.

cut -f 1,$(
    head -n1 data.txt |
    tr '\t' '\n' |
    grep -nf list.txt |
    sed ':a;$!N;s/:[^\n]*\n/,/;ta;s/:.*//'
) data.txt

Question 2

다음과 같이 시도해 볼 수 있습니다.

awk  -F'\t' -f script.awk column.names data

어디 script.awk:

NR == FNR { columns[NR] = $0; next }
NR > FNR && FNR == 1 {
    for (i = 1; i <= NF; i++) {
        for (j = 1; j < NR; j++) {
            if ($i ~ columns[j]) {
                selected[i] = 1;
                break;
            }
        }
    }
}
{
    for (i = 1; i <= NF; i++) {
        if (i in selected) printf $i "\t";
    }
    print "";
}

@Costas의 접근 방식은 독창적입니다. 그러나 조금 단순화할 수 있다고 생각합니다.

head -n1 data | tr '\t' '\n' | grep -nf column.names | cut -f1 -d: \
  | paste -sd, | xargs -I{} cut -f {} data

Answer

다음과 같이 시도해 볼 수 있습니다.

awk  -F'\t' -f script.awk column.names data

어디 script.awk:

NR == FNR { columns[NR] = $0; next }
NR > FNR && FNR == 1 {
    for (i = 1; i <= NF; i++) {
        for (j = 1; j < NR; j++) {
            if ($i ~ columns[j]) {
                selected[i] = 1;
                break;
            }
        }
    }
}
{
    for (i = 1; i <= NF; i++) {
        if (i in selected) printf $i "\t";
    }
    print "";
}

@Costas의 접근 방식은 독창적입니다. 그러나 조금 단순화할 수 있다고 생각합니다.

head -n1 data | tr '\t' '\n' | grep -nf column.names | cut -f1 -d: \
  | paste -sd, | xargs -I{} cut -f {} data

용어 목록이 포함된 모든 열 추출

답변1

답변2

관련 정보