쉘 스크립트를 사용하여 대규모 코퍼스의 데이터를 필터링하는 방법은 무엇입니까? [폐쇄]

쉘 스크립트를 사용하여 대규모 코퍼스의 데이터를 필터링하는 방법은 무엇입니까? [폐쇄]

대규모 트위터 코퍼스에서 트윗을 추출하고 트윗이 게시된 특정 위치에서 필터링하려고 합니다. 그런 다음 트윗에서 특정 단어를 검색하고 싶습니다. tsv 파일의 모든 트윗을 나열하는 명령이 있습니다. $ zless location/of/tweets.out.gz | /net/corpora/twitter2/tools/tweet2tab -i user.location text

그러면 탭으로 구분된 다음 출력이 제공됩니다. user.location tweet

이제 의 트윗을 나열하고 싶습니다 location: Amsterdam. 그런 다음 word: hallo암스테르담의 모든 트윗 중에서 검색하세요. 쉘 스크립트를 사용하여 이 문제를 해결하는 가장 좋은 방법은 무엇입니까?

관련 정보