awk 구분 기호로 열 분할

Question

귀하의 질문에서 완전히 명확하지는 않지만 (아래 내 의견 참조) "이중 항목이 첫 번째 항목을 취하는 곳"이라고 가정하면 FOO=bar각 행에 중복 항목이 있다는 것을 의미합니다. 이것이 당신이 원하는 것일 수 있다고 생각합니다. do (모든 Unix 시스템의 모든 쉘에서 awk 사용):

$ cat tst.awk
BEGIN { OFS=";" }
{
    delete f
    n = split($7,subFlds,/;/)
    for (i=1; i<=n; i++) {
        tag = val = subFlds[i]
        sub(/=.*/,"",tag)
        sub(/,.*/,"",val)
        if ( !(tag in f) ) {
            f[tag] = val
        }
    }
    print f["AF"], f["FSAF"], f["FSAR"]
}

$ awk -f tst.awk file
AF=0.730769;FSAF=12;FSAR=7
AF=0.6;FSAF=3;FSAR=3
AF=0.266667;FSAF=0;FSAR=4

물론, 출력 구분 기호의 형식이 OFS요구 사항에 맞지 않으면 원하는 대로 변경할 수 있습니다.

데이터에 태그=값 쌍이 있을 때마다 먼저 값 매핑( f[]위)에 대한 태그 배열(일명 이름)을 생성한 다음 원하는 태그별로 값을 인쇄/테스트/수정/모든 값을 인쇄/테스트/수정할 수 있습니다. 마음에 드는 것을 주문하세요.

위의 방법은 레이블이 입력에서 항상 동일한 순서로 표시되지 않거나 일부 행에서 일부 레이블이 누락되는 경우에도 작동합니다.

Answer 1

귀하의 질문에서 완전히 명확하지는 않지만 (아래 내 의견 참조) "이중 항목이 첫 번째 항목을 취하는 곳"이라고 가정하면 FOO=bar각 행에 중복 항목이 있다는 것을 의미합니다. 이것이 당신이 원하는 것일 수 있다고 생각합니다. do (모든 Unix 시스템의 모든 쉘에서 awk 사용):

$ cat tst.awk
BEGIN { OFS=";" }
{
    delete f
    n = split($7,subFlds,/;/)
    for (i=1; i<=n; i++) {
        tag = val = subFlds[i]
        sub(/=.*/,"",tag)
        sub(/,.*/,"",val)
        if ( !(tag in f) ) {
            f[tag] = val
        }
    }
    print f["AF"], f["FSAF"], f["FSAR"]
}

$ awk -f tst.awk file
AF=0.730769;FSAF=12;FSAR=7
AF=0.6;FSAF=3;FSAR=3
AF=0.266667;FSAF=0;FSAR=4

물론, 출력 구분 기호의 형식이 OFS요구 사항에 맞지 않으면 원하는 대로 변경할 수 있습니다.

데이터에 태그=값 쌍이 있을 때마다 먼저 값 매핑( f[]위)에 대한 태그 배열(일명 이름)을 생성한 다음 원하는 태그별로 값을 인쇄/테스트/수정/모든 값을 인쇄/테스트/수정할 수 있습니다. 마음에 드는 것을 주문하세요.

위의 방법은 레이블이 입력에서 항상 동일한 순서로 표시되지 않거나 일부 행에서 일부 레이블이 누락되는 경우에도 작동합니다.

awk 구분 기호로 열 분할

답변1

관련 정보