CSV 파서를 사용하여 특정 열을 기반으로 CSV 행 중복 제거
이 작업을 검색한 결과 다음과 같은 오래된 질문을 발견했습니다. 지정된 열을 기반으로 CSV에서 중복 항목 제거 특정 열을 기반으로 CSV에서 고유한 레코드 식별 awk하지만 내 데이터가 여러 개의 중첩된 큰따옴표가 있는 복잡한 CSV 파일이기 때문에 그렇게 할 수 없습니다 . 다음과 같은 중복을 제거하고 싶다고 가정해 보겠습니다(단순화된 상황). Ref,xxx,zzz ref1,"foo, bar, base",qux ref1,"foo, bar, base",bar ref2,aaa,bbb 출력에는 다...