PDF에서 패턴을 추출하여 텍스트 파일로 저장하는 방법

PDF에서 패턴을 추출하여 텍스트 파일로 저장하는 방법

쉘을 사용하여 PDF 파일에 포함된 특정 패턴을 텍스트 파일로 추출하는 방법은 무엇입니까?

답변1

PDF는 형식이 지정된 데이터이므로 셸에서 해당 내용에 액세스할 수 없습니다. 하지만 PDF가 설치되어 있으면 텍스트를 입력하고 패턴을 검색하는 데 사용할 poppler-utils수 있습니다 .convertgrep

pdftotext my.pdf - | grep 'your_pattern' > example.txt

따라서 파일에 패턴이 있습니다 example.txt.

관련 정보