대규모 트위터 코퍼스에서 트윗을 추출하고 트윗이 게시된 특정 위치에서 필터링하려고 합니다. 그런 다음 트윗에서 특정 단어를 검색하고 싶습니다. tsv 파일의 모든 트윗을 나열하는 명령이 있습니다.
$ zless location/of/tweets.out.gz | /net/corpora/twitter2/tools/tweet2tab -i user.location text
그러면 탭으로 구분된 다음 출력이 제공됩니다.
user.location tweet
이제 의 트윗을 나열하고 싶습니다 location: Amsterdam
. 그런 다음 word: hallo
암스테르담의 모든 트윗 중에서 검색하세요. 쉘 스크립트를 사용하여 이 문제를 해결하는 가장 좋은 방법은 무엇입니까?