uniq와 agrep의 조합?
한 줄에 하나씩 긴 SQL 쿼리로 가득 찬 파일이 있습니다. 고유한 쿼리 목록을 만들어야 하는데 대부분의 쿼리에 매개변수 값이 포함되어 있어 정확한 일치 도구를 사용할 uniq수 없습니다. 예를 들어, 고유한 줄을 "퍼지"하는 방법이 있습니까 agrep? ...
한 줄에 하나씩 긴 SQL 쿼리로 가득 찬 파일이 있습니다. 고유한 쿼리 목록을 만들어야 하는데 대부분의 쿼리에 매개변수 값이 포함되어 있어 정확한 일치 도구를 사용할 uniq수 없습니다. 예를 들어, 고유한 줄을 "퍼지"하는 방법이 있습니까 agrep? ...
부정확한 검색 외에 grep이와 유사하거나 심지어 유틸리티가 있습니까? 아니면 직접 작성해야 합니까?uniq 내 말은 90%(숫자는 다를 수 있음) 일치 또는 이와 유사한 것으로 보인다는 것입니다. 예를 들어, 여러 문자열이 포함된 파일이 있습니다. abc123 abd123 abc223 qwe938 이 경우 해당 유틸리티는 처음 세 개의 문자열을 반환하거나 유사하다고 말해야 합니다. 물론, grep또는 를 사용하는 경우 와 같은 파일 내용의 패턴을 알지 못합니다 uniq. ...
나는 사용하고있다tre-agrep (맨페이지), 구현agrep (맨페이지), 대략적인 패턴 일치를 수행합니다. 유틸리티는 다음을 기준으로 일치 항목을 검색합니다.거리 편집, 사용자는 편집 내용을 대체, 삽입 또는 삭제하기 위해 적용되는 페널티를 구성할 수 있습니다. 그러나 쿼리 길이에 따라 다른 가중치를 적용하고 싶습니다. 즉, 쿼리 시작 부분(왼쪽 끝)의 삭제는 오른쪽 삭제보다 가중치가 낮습니다. 이 유틸리티 페이지에서는 man이러한 수준의 제어가 가능하다고 제안하지 않습니다. 대략적인 일치를 ...
편집: 텍스트 필드의 공백을 더 잘 처리하기 위해 파일이 tsv로 변경되었습니다. 다음 형식의 csv 파일이 2개 있습니다. 파일 1: availableText.csv(크기가 클 수 있음) "id1", "text1-1" , "id1", "text1-2", "id1", "text1-3", "id1", "text1-4" , "id2", "text2-1", "id2", "text2-2" "id2", "text2-3" "id2", "text2-4" ....