ASCII가 아닌 내용이 포함된 PDF를 탐지하기 위한 쉘 스크립트

ASCII가 아닌 내용이 포함된 PDF를 탐지하기 위한 쉘 스크립트

유효한 PDF를 감지하려면 쉘 스크립트가 필요합니다. 즉, 순수한 ASCII PDF만 유지하면 됩니다. ASCII가 아닌 콘텐츠와 악성 스크립트가 포함된 기타 PDF는 제거해야 합니다. 어떻게 해야 하나요? 이 작업을 수행하는 데 사용할 수 있는 스크립트가 있습니까?

답변1

당신이 원하는 것은 바이러스 스캐너라는 것입니다. 예를 들어.조개 바이러스

답변2

다음은 몇 가지 Python 스크립트입니다. "Malware Archives: PDF File" Bruce Schneier는 자신의 웹사이트에서도 이에 대해 언급했습니다.

pdf2ps는 간단하지만 확실하지는 않습니다. 흥미로운 PDF/A입니다.http://en.wikipedia.org/wiki/PDF/A멀티미디어 요소는 허용되지 않습니다.

관련 정보