Awk는 특정 열을 기반으로 모든 정규화된 열을 결정하고 출력합니다.

Question

$ awk -F'\t' 'split($2,a," ") >= 2' input.txt 
1       a b c d e       Tom
2       a b     Jason

TAB을 필드 구분 기호로 사용하면 $2공백으로 구분된 두 개 이상의 문자열이 포함된 각 줄이 인쇄됩니다.

split()정규식을 구분 기호(이 경우 단일 공백)로 사용하여 $2문자열( )을 배열( )로 분할합니다 . 이 기능에 대한 자세한 내용은 을 a참조하십시오.man awksplit

이 awk one-liner는 배열의 내용을 사용하거나 신경 쓰지 않고 a단지 분할 함수의 반환 값(문자열이 분할된 요소 수)을 확인합니다. 2보다 크거나 같으면 조건은 true로 평가되고 전체 줄이 인쇄됩니다.

그런데 이것이 어떻게 작동하는지 더 잘 이해하고 싶다면 각 $2의 요소 수를 살펴보는 것이 도움이 됩니다. 예를 들어, 반환 값을 split변수 에 할당한 n다음 입력 라인과 함께 인쇄하는 다음 과 같습니다 .

$ awk -F'\t' '{n=split($2,a," ");printf "(n=%i)\t%s\n",n,$0}' input.txt 
(n=5)   1       a b c d e       Tom
(n=2)   2       a b     Jason
(n=1)   3       c       Lisa
(n=1)   4       e       Kim

따라서 첫 번째 행에는 5개의 요소가 있고, 두 번째 행에는 2개의 요소가 있으며, 마지막 두 행에는 각각 하나의 요소만 있습니다.

Answer 1

$ awk -F'\t' 'split($2,a," ") >= 2' input.txt 
1       a b c d e       Tom
2       a b     Jason