awk는 배열을 이전 줄의 배열과 비교합니다.

Question

댓글에 URL로 제공되는 입력 데이터는 탭으로 구분됩니다. 이는 탭으로 구분된 첫 번째 필드를 일종의 "키"로 구문 분석하여 다른 행과 비교할 수 있음을 의미합니다. 사실 우리는아니요첫 번째 필드의 공백으로 구분된 단어에 주의해야 하지만 첫 번째 필드 전체를 단일 엔터티로 처리할 수 있습니다.

BEGIN { OFS = FS = "\t" }

{
    count = $(NF - 1)
    key = $1
}

key != previous {
    if (previous != "")
        print previous, sum

    sum = 0
}

{
    sum += count
    previous = key
}

END {
    if (previous != "")
        print previous, sum
}

프로그램 awk은 "count" 필드(두 번째 필드)를 구문 분석한 count다음 나중에 이전 행의 키와 비교할 수 있도록 첫 번째 필드를 "키"로 사용합니다. 이는 이 블록 BEGIN(입력 및 출력 구분 기호만 설정) 다음의 첫 번째 블록입니다 .

키가 이전 행의 키와 다르다면 이는 이제 다른 단어 집합을 보고 있다는 의미입니다. 이전 라인의 키와 합을 출력하고 합을 재설정합니다.

모든 행에 대해 해당 행의 개수에 합계를 더한 다음 업데이트합니다 previous(이제 행을 완료했으므로 key다음 행이 됩니다 previous).

마지막으로 데이터의 마지막 행 정보를 출력합니다.

를 사용하여 실행할 수 있습니다 awk -f script.awk inputfile.

"한 줄"로:

awk -F '\t' 'BEGIN{OFS=FS} {c=$(NF-1);k=$1} k!=p {if(p!="")print p,s;s=0} {s+=c;p=k} END {if(p!="") print p,s}' file

Answer 1