내가 사용하고 있는 텍스트 파일에는 가장 많이 팔린 노래가 포함되어 있습니다. 그 구조는 다음과 같습니다:
Single,Artist,Record label,Released,Chart,Traditional sales peak,
몇 가지 예시 라인은 다음과 같습니다:
Imagine,John Lennon,Apple,Oct-75,1,1714351
Uptown Funk,Mark Ronson featuring Bruno Mars,RCA,Dec-14,1,1647310
Wonderwall,Oasis,Creation,Oct-95,2,1502270
파일의 클릭수가 어느 연도에 발생했는지 알아내려고 합니다.
예를 들어 보다 효율적인 명령을 사용할 수 있다는 것을 알고 있지만 awk
이를 수행하려면 을 사용해야 합니다 grep
.
도움이나 안내를 주시면 감사하겠습니다 :)
답변1
여기 있습니다:
$ grep -oP '^([^,]+,){3}\w+-\K\d+' file | sort | uniq -c
1 14
1 75
1 95
하지만 수세기가 없는 한 복잡한 프로세스/휴리스틱이 필요한 이상한 결과가 있습니다.