awk를 통해 파일 분할

Question 1

$ awk 'NF>3' file
       1   a b    tom
       2   a b c  sim
       4   o l    shey

$ awk -v OFS='\t' 'NF>3{for (i=2;i<NF;i++) print $1, $i, $NF}' file
1       a       tom
1       b       tom
2       a       sim
2       b       sim
2       c       sim
4       o       shey
4       l       shey

코드가 작동하지 않는 이유에 대해 가장 명백한 문제는 공백으로 구분되어 있다고 말하고 표시할 때 쉼표로 구분하려고 split($2,aa,",")하는 것 입니다.$2

Answer

$ awk 'NF>3' file
       1   a b    tom
       2   a b c  sim
       4   o l    shey

$ awk -v OFS='\t' 'NF>3{for (i=2;i<NF;i++) print $1, $i, $NF}' file
1       a       tom
1       b       tom
2       a       sim
2       b       sim
2       c       sim
4       o       shey
4       l       shey

코드가 작동하지 않는 이유에 대해 가장 명백한 문제는 공백으로 구분되어 있다고 말하고 표시할 때 쉼표로 구분하려고 split($2,aa,",")하는 것 입니다.$2

Question 2

두 번째 단계에서는 밀러의 대체 솔루션과 필드 2의 공백을 기반으로 레코드를 선택하는 아이디어를 사용합니다(필드 2에 두 개 이상의 요소가 있는 경우에만 공백이 발생한다고 가정).

awk -F'\t' '$2 ~ / /' |
tee out1 | 
mlr --tsv -N nest --explode --values --across-records --nested-fs " " -f 2 >out2

Answer

두 번째 단계에서는 밀러의 대체 솔루션과 필드 2의 공백을 기반으로 레코드를 선택하는 아이디어를 사용합니다(필드 2에 두 개 이상의 요소가 있는 경우에만 공백이 발생한다고 가정).

awk -F'\t' '$2 ~ / /' |
tee out1 | 
mlr --tsv -N nest --explode --values --across-records --nested-fs " " -f 2 >out2

awk를 통해 파일 분할

답변1

답변2

관련 정보