문자 세트 사용에 따라 mutt에서 메시지를 선택하는 방법은 무엇입니까?

문자 세트 사용에 따라 mutt에서 메시지를 선택하는 방법은 무엇입니까?

한자 또는 키릴 문자(러시아어)를 사용하는 모든 메시지는 모두 스팸이므로 삭제 표시를 하려고 합니다.

답변1

다음을 사용하여 인코딩을 필터링할 수 있습니다 foo.~h^content-type:.*foo

그러나 이는 상당히 제한적입니다. 첫째, 특정 문자(한자, 키릴 문자...)를 사용하는 메시지는 UTF-8로 인코딩될 수 있습니다. 또한 첨부 파일이 있는 메시지의 경우 인코딩은 Mutt 모드 관점의 본문인 MIME 첨부 파일의 헤더에 지정됩니다. ~Bfoo그러나 이 방법은 속도가 느리고 오탐이 발생할 수 있습니다. 이는 content-type첨부 파일 제목이 둘 이상의 본문 줄에 있을 수 있기 때문입니다.

스크립트를 인식할 수 있는 외부 도구가 있을 수 있지만 이는 더 이상 Mutt와 관련이 없습니다...

스팸 필터링을 위한 것이라면 베이지안 필터가 적합할 수 있습니다(어떤 스크립트인지 알 필요 없음).

특정 스크립트에 속하는 특정 문자의 존재 여부를 필터링할 수도 있습니다.정규 표현식을 사용하여 UTF-8로 인코딩된 모든 중국어 문자와 일치. 이것은 아직 Mutt에서는 작동하지 않지만(아마도 미래에는) 그 동안은 외부 도구를 사용하여 작동할 것입니다.

먼저 디코딩하지 않고 필터링하는 것도 가능합니다(더 빠릅니다). 예를 들어, 나는 현재 postfix에서 일부 러시아어 스팸을 필터링하기 위해 다음 pcre 정규식(대소문자 구분)을 사용하고 있습니다.

/^Subject:\s*"?=\?[Uu][Tt][Ff]-8\?[Bb]\?(0[J-Z]|(KN|W9)[C-R])/i

관련 정보