PDF 파일이 이미지로 구성되어 있는지 감지

Question 1

pdfimages -list filename.pdf

이 작업을 수행해야 합니다. 그러면 PDF 파일에 포함된 이미지 목록이 제공됩니다.

Answer

pdfimages -list filename.pdf

이 작업을 수행해야 합니다. 그러면 PDF 파일에 포함된 이미지 목록이 제공됩니다.

Question 2

pdftotext를 설치하고 더 많은 출력 문자열을 생성하는지 확인할 수 있습니다.

for file_name in *.pdf; do
   if [ $(pdftotext "$file_name")"x" == "x" ] ; then mv "$file_name" /to/ocr ; fi
done

Debian에서 이 유틸리티는 패키지에 있습니다 poppler-utils.

Answer

pdftotext를 설치하고 더 많은 출력 문자열을 생성하는지 확인할 수 있습니다.

for file_name in *.pdf; do
   if [ $(pdftotext "$file_name")"x" == "x" ] ; then mv "$file_name" /to/ocr ; fi
done

Debian에서 이 유틸리티는 패키지에 있습니다 poppler-utils.

관련 정보