PDF 파일이 압축되었는지 확인하는 방법과 압축(압축 풀기) 방법

PDF 파일이 압축되었는지 확인하는 방법과 압축(압축 풀기) 방법

방금 PDF 파일을 압축하여 디스크 크기를 줄일 수 있다는 것을 배웠습니다.

  1. PDF 파일이 압축되었는지 확인하는 방법을 알고 싶습니다.
  2. PDF 파일을 압축하거나 압축을 푸는 데 어떤 응용 프로그램/명령을 사용할 수 있습니까?

내 환경은 Linux Ubuntu 10.10입니다.


일부 시도에서는 만족스러운 결과를 얻지 못했습니다.

  1. 시도 결과는 다음과 같습니다 pdftk.

    $ pdftk 3.pdf output 5.pdf uncompress 
    $ pdftk 3.pdf output 3comp.pdf compress 
    $ ls -l 3.pdf 3comp.pdf 5.pdf
    -rwxrwx--- 1 root plugdev  8652269 2011-07-30 12:27 3comp.pdf
    -rwxrwx--- 1 root plugdev  8652319 2011-07-29 22:15 3.pdf
    -rwxrwx--- 1 root plugdev 16829828 2011-07-30 12:27 5.pdf
    

    파일 속성에 따르면 모든 파일이 최적화되지 않은 것으로 표시됩니다.

  2. ps로 변환한 후 다시 pdf로 변환한 결과:

    $ pdf2ps 3.pdf 3.ps
    $ ps2pdf 3.ps 3c.pdf
    $ ls -l 3.pdf 3.ps 3c.pdf
    -rwxrwx--- 1 root plugdev   8808946 2011-07-30 13:14 3c.pdf
    -rwxrwx--- 1 root plugdev   8652319 2011-07-29 22:15 3.pdf
    -rwxrwx--- 1 root plugdev 122375966 2011-07-30 13:14 3.ps
    

답변1

간단히 말해서:

압축되었는지 확인하려면 다음을 수행하세요.

strings your.pdf | grep /Filter

PDF를 (압축 해제)하려면 다음을 사용하십시오.양자 PDF

qpdf --stream-data=compress your.pdf compressed.pdf
qpdf --stream-data=uncompress compressed.pdf uncompressed.pdf  

설명하다:

PDF 파일의 "필터" 키워드는 사용된 압축 방법을 나타냅니다. 그 중 일부는 다음과 같습니다:

CCITT G3/G4 – 흑백 이미지용
JPEG – 이미지용 손실 알고리즘
JPEG2000 – JPEG의 최신 대안, 이미지 압축에도 사용
Flate – 텍스트 및 이미지 압축용
JBIG2 – JPEG의 대안 흑백 이미지용 CCITT 압축
LZW – 텍스트와 이미지를 압축하지만 Flate로 대체
RLE – 흑백 이미지용
ZIP – 회색조 또는 컬러 이미지용

(에서 복사여기).

그러나 PDF의 복잡한 파일 구조를 고려할 때 대부분의 경우 PDF의 일부 부분(또는 "스트림")은 이미 어떤 방식으로든 압축되어 있으며(grep /Filtering 시 표시됨) 다른 부분은 그렇지 않습니다. PDF가 압축되었는지 여부에 대한 질문에 대한 대답은 "예"/"아니요"입니다.
이 문제를 해결하는 한 가지 방법은 -c발생 횟수를 반환하는 옵션을 grep에 추가하는 것입니다.비교적얼마나 압축되어 있습니까? 예를 들어,strings "large.pdf" | grep -c /Filter상당히 압축되지 않은 10 미만을 반환합니다.

PDF 크기와 관련된 또 다른 속성은 빠른 액세스에 최적화되어 있는지 여부입니다. "최적화된" PDF는 크기가 더 큽니다.위키피디아:

PDF 파일은 비선형("최적화" 아님) 및 선형("최적화")의 두 가지 레이아웃으로 제공됩니다. 비선형 PDF 파일은 선형 PDF 파일보다 디스크 공간을 덜 차지하지만 문서 페이지를 구성하는 데 필요한 일부 데이터가 PDF 파일 전체에 분산되어 있기 때문에 액세스 속도가 더 느립니다. 선형 PDF 파일("최적화" 또는 "웹 최적화" PDF 파일이라고도 함)은 웹 브라우저 플러그인에서 읽기 때문에 전체 파일이 다운로드될 때까지 기다릴 필요 없이 웹 브라우저 플러그인에서 읽을 수 있는 방식으로 구축되었습니다. 선형(페이지 순차) 방식입니다. PDF 파일은 Adobe Acrobat 소프트웨어 또는 QPDF를 사용하여 최적화할 수 있습니다.

를 사용하여 PDF가 최적화되었는지 확인할 수 있습니다 pdfinfo your.pdf.

답변2

pdftk압축/압축 해제와 같은 PDF 파일에 대한 일부 작업을 수행하는 도구입니다.

$ pdftk test.pdf output compressed_test.pdf compress

답변3

PDF 파일에서 압축 방법을 찾았습니다. 텍스트 편집기를 사용하여 PDF를 엽니다. 검색을 실행하거나 찾으세요. 찾을 수 없으면 CCITT를 입력한 다음 JPEG, Flate, JBIG2, LZW, RLE, ZIP을 입력하세요.
실제보다 더 나쁘게 들리네요! 데이터 스트림의 압축 방법을 찾는 것은 쉽습니다.

답변4

속성을 확인하면 파일이 압축되었는지 여부를 알 수 있습니다.

관련 정보