쉘을 사용하여 PDF 파일에 포함된 특정 패턴을 텍스트 파일로 추출하는 방법은 무엇입니까?
답변1
PDF는 형식이 지정된 데이터이므로 셸에서 해당 내용에 액세스할 수 없습니다. 하지만 PDF가 설치되어 있으면 텍스트를 입력하고 패턴을 검색하는 데 사용할 poppler-utils
수 있습니다 .convert
grep
pdftotext my.pdf - | grep 'your_pattern' > example.txt
따라서 파일에 패턴이 있습니다 example.txt
.