악성 PDF에서 메타데이터를 추출하는 코드/도구

Question

손상된 PDF 파일을 확인하는 가장 쉬운 방법은 대용량 파일을 처리할 수 있는 편집기에서 해당 파일을 여는 것입니다(저는 emacs를 사용합니다). 먼저 좋은 PDF 파일을 사용해 보세요. PDF 파일의 개체 구조가 표시되지만 콘텐츠 스트림의 일부 또는 전체가 압축됩니다. 이렇게 하면 "악성" PDF가 파서를 혼란시키기 위해 무엇을 하는지 확인할 수 있으며 이에 따라 파서를 수정할 수 있습니다. ("악성" PDF가 무엇을 하는지 알지 못하면 우리는 분명히 이 작업을 수행할 수 없습니다.)

mutool clean -d압축 해제된 스트림을 사용할 수도 있지만 mutool손상된 PDF의 기능으로 인해 혼란스러울 수도 있고 그렇지 않을 수도 있습니다. 다시 한 번 유효한 PDF에서 먼저 시도해 보세요.

Answer 1

손상된 PDF 파일을 확인하는 가장 쉬운 방법은 대용량 파일을 처리할 수 있는 편집기에서 해당 파일을 여는 것입니다(저는 emacs를 사용합니다). 먼저 좋은 PDF 파일을 사용해 보세요. PDF 파일의 개체 구조가 표시되지만 콘텐츠 스트림의 일부 또는 전체가 압축됩니다. 이렇게 하면 "악성" PDF가 파서를 혼란시키기 위해 무엇을 하는지 확인할 수 있으며 이에 따라 파서를 수정할 수 있습니다. ("악성" PDF가 무엇을 하는지 알지 못하면 우리는 분명히 이 작업을 수행할 수 없습니다.)

mutool clean -d압축 해제된 스트림을 사용할 수도 있지만 mutool손상된 PDF의 기능으로 인해 혼란스러울 수도 있고 그렇지 않을 수도 있습니다. 다시 한 번 유효한 PDF에서 먼저 시도해 보세요.

악성 PDF에서 메타데이터를 추출하는 코드/도구

답변1

관련 정보