한자 또는 키릴 문자(러시아어)를 사용하는 모든 메시지는 모두 스팸이므로 삭제 표시를 하려고 합니다.
답변1
다음을 사용하여 인코딩을 필터링할 수 있습니다 foo
.~h^content-type:.*foo
그러나 이는 상당히 제한적입니다. 첫째, 특정 문자(한자, 키릴 문자...)를 사용하는 메시지는 UTF-8로 인코딩될 수 있습니다. 또한 첨부 파일이 있는 메시지의 경우 인코딩은 Mutt 모드 관점의 본문인 MIME 첨부 파일의 헤더에 지정됩니다. ~Bfoo
그러나 이 방법은 속도가 느리고 오탐이 발생할 수 있습니다. 이는 content-type
첨부 파일 제목이 둘 이상의 본문 줄에 있을 수 있기 때문입니다.
스크립트를 인식할 수 있는 외부 도구가 있을 수 있지만 이는 더 이상 Mutt와 관련이 없습니다...
스팸 필터링을 위한 것이라면 베이지안 필터가 적합할 수 있습니다(어떤 스크립트인지 알 필요 없음).
특정 스크립트에 속하는 특정 문자의 존재 여부를 필터링할 수도 있습니다.정규 표현식을 사용하여 UTF-8로 인코딩된 모든 중국어 문자와 일치. 이것은 아직 Mutt에서는 작동하지 않지만(아마도 미래에는) 그 동안은 외부 도구를 사용하여 작동할 것입니다.
먼저 디코딩하지 않고 필터링하는 것도 가능합니다(더 빠릅니다). 예를 들어, 나는 현재 postfix에서 일부 러시아어 스팸을 필터링하기 위해 다음 pcre 정규식(대소문자 구분)을 사용하고 있습니다.
/^Subject:\s*"?=\?[Uu][Tt][Ff]-8\?[Bb]\?(0[J-Z]|(KN|W9)[C-R])/i