단일 문서에 대한 코드
pdftotext *.pdf - | grep therapy
find
스레드에 설명된 대로 사용할 수 있습니다.PDF 파일에 대해 grep 작업을 수행하는 방법은 무엇입니까?하지만 위 명령이 작동하지 않는 이유를 알고 싶습니다.
코드를 차별화하면 pdfgrep
몇 가지 이점을 얻을 수 있지만 아직 개발 초기 단계입니다.
pdftotext *.pdf - | pdfgrep therapy
#Wrong syntax so error
# Usage: pdfgrep [OPTION]... PATTERN FILE...
# Syntax Warning: Invalid Font Weight
# Syntax Warning: Invalid Font Weight
일치하는 항목이 있으면 특정 PDF 페이지로 빠르게 이동할 수 있는 방법을 찾고 싶습니다. 그러나 그러한 기능이 존재한다는 증거는 찾지 못했습니다.
운영 체제: Debian 8.5
Linux 커널: 4.6 백포트
하드웨어: Asus Zenbook UX303UA
Poppler-utils: pdftotext
답변1
그냥 직접 사용하십시오 pdfgrep
.
pdfgrep -n therapy *.pdf
이 -n
옵션은 각 게임의 페이지 번호를 표시합니다.
답변2
이것을 시도해 볼 수 있습니다.
pdfgrep therapy *.pdf
또는
find /tmp -name '*.pdf' -exec pdfgrep test {} +
예를 들어;
user@host $ pdfgrep test *.pdf
1.pdf:test1
1.pdf:test2
1.pdf:test3
2.pdf:test1
2.pdf:test2
2.pdf:test3
test (copy).pdf:test1
test (copy).pdf:test2
test (copy).pdf:test3
user@host $ find /tmp -name '*.pdf' -exec pdfgrep test {} +
/tmp/test (copy).pdf:test1
/tmp/test (copy).pdf:test2
/tmp/test (copy).pdf:test3
/tmp/1.pdf:test1
/tmp/1.pdf:test2
/tmp/1.pdf:test3
/tmp/2.pdf:test1
/tmp/2.pdf:test2
/tmp/2.pdf:test3