PDF에서 메타데이터 제거

PDF에서 메타데이터 제거

모든 메타데이터를 제거하려면 어떤 되돌릴 수 없는 명령을 실행해야 합니까 foo.pdf? 삽입된 이미지가 이미 깨끗하다고 ​​가정합니다.

내 인상은 다음에서 비롯됩니다

https://gist.github.com/hubgit/6078384

저것

exiftool -all:all= foo.pdf
qpdf --linearize foo.pdf bar.pdf

충분할 수도 있지만 완전히 완전한 접근 방식인지는 확실하지 않습니다. pdftk내가 이해하지 못하는 "정보 사전" 에 대한 이야기가 있습니다 .

답변1

라는 도구가 있습니다.MAT(메타데이터 익명화 툴킷)메타데이터는 다양한 형식에서 제거될 수 있습니다. 우분투에서는 다음과 같이 사용합니다.

sudo apt install mat2

mat2 filename.pdf  # you will now end up with a file called filename.cleaned.pdf

mat2 --inplace filename.pdf  # this will overwrite original file with the new one, effectively removing the original file

mat2 --show filename.pdf  # this will show the metadata that will be removed, if any (similar to dry run) 

정리된 파일은 원본 파일보다 파일 크기가 작거나 커집니다.

하나 있다모델(추가만 하면 됩니다 --lightweight.) 위 명령을 사용하여 정리된 이미지가 pdf 파일과 같은 매우 큰 파일을 생성하는지 확인할 수 있습니다. 그러나 이로 인해 일부 메타데이터가 남을 수 있습니다. 이 exiftool명령을 사용하여 정리된 이미지에서 여전히 메타데이터가 유출되는지 확인하세요.

답변2

cpdf -remove-metadata input.pdf -o output.pdf

직접 검증하지는 않았지만 cpdf매우 안정적이고 유용한 도구입니다.여기, 비상업적 용도로는 무료이며 Linux 명령줄용으로 미리 컴파일된 바이너리로 사용할 수 있습니다.

마지막으로 파일 크기가 더 작아졌습니다.)

답변3

노력하다메타데이터 클리너평평한 바퀴에.

관련 정보