pdfimages를 사용하여 이미지를 추출하는 중 문제 발생

Question

PDF에는 각 페이지의 이미지가 포함되어 있으며 각 이미지에는 전체 스캐너 영역이 포함되어 있습니다. PDF는 실제로 포함된 정보의 일부만 표시하기 위해 변환, 크기 조정 등을 할 수 있습니다.

페이지를 얻는 또 다른 방법은 다음과 같습니다.

$ pdftoppm -cropbox -jpeg file.pdf prefix

이렇게 하면 이미지가 가져와서 pdf 파일의 "자르기 상자"에 따라 잘립니다(아래 설명 참조).

Answer 1

PDF에는 각 페이지의 이미지가 포함되어 있으며 각 이미지에는 전체 스캐너 영역이 포함되어 있습니다. PDF는 실제로 포함된 정보의 일부만 표시하기 위해 변환, 크기 조정 등을 할 수 있습니다.

페이지를 얻는 또 다른 방법은 다음과 같습니다.

$ pdftoppm -cropbox -jpeg file.pdf prefix

이렇게 하면 이미지가 가져와서 pdf 파일의 "자르기 상자"에 따라 잘립니다(아래 설명 참조).

관련 정보