목록을 비교하고 중복된 항목을 유지합니다. [중복]

목록을 비교하고 중복된 항목을 유지합니다. [중복]

중복된 항목이 많은 목록이 있습니다. 예를 들면 다음과 같습니다.

AARC
AARC
AARC
TNGT
TNGT
TNGT
CAAC
CAAC

다음과 같이 중복되지 않은 목록이 있습니다.

AARC
TNGT
YUGT
BATR

등.

첫 번째 목록의 모든 항목은 두 번째 목록에 표시되지만 그 반대의 경우는 표시되지 않습니다.

목록을 비교하고 두 목록에 몇 개의 항목이 있는지 확인하고 싶지만 중복 항목을 유지하고 식별하고 싶습니다. 예를 들어 출력은 다음과 같을 수 있습니다.

AARC
AARC
AARC
TNGT
TNGT
TNGT

또는

AARC\tAARC
AARC\tAARC
AARC\tAARC
TNGT\tTNGT
TNGT\tTNGT
TNGT\tTNGT

내가 겪고 있는 문제는 comm이 첫 번째 중복 항목을 가져오고 앞으로 이동하여 후속 항목을 공유되지 않은 항목으로 계산한다는 것입니다. 모든 기사를 온라인에서 찾아 중복된 기사를 보관하는 대신 제거할 수 있습니다. 이 목적으로 사용할 수 있는 데이터베이스가 있었지만 최근에는 중복 항목을 제거하도록 기본 동작을 변경했으며 수동으로 수행할 수 없는 항목이 수천 개 있습니다./

답변1

잘 이해했다면 두 번째 목록에 없는 첫 번째 목록의 모든 단어를 필터링하고 싶습니다.

당신은 그것을 사용할 수 있습니다grep그런 이유로. 이 명령은 다음과 같습니다.

grep -w -f list2.txt list1.txt

다음을 출력합니다:

AARC
AARC
AARC
TNGT
TNGT
TNGT

또한 확인이 스레드.

관련 정보