많은 문서에서 pdftotext ... grep을 실행하는 방법은 무엇입니까? [복사]

많은 문서에서 pdftotext ... grep을 실행하는 방법은 무엇입니까? [복사]

단일 문서에 대한 코드

pdftotext *.pdf - | grep therapy

find스레드에 설명된 대로 사용할 수 있습니다.PDF 파일에 대해 grep 작업을 수행하는 방법은 무엇입니까?하지만 위 명령이 작동하지 않는 이유를 알고 싶습니다.

코드를 차별화하면 pdfgrep몇 가지 이점을 얻을 수 있지만 아직 개발 초기 단계입니다.

pdftotext *.pdf - | pdfgrep therapy
#Wrong syntax so error
# Usage: pdfgrep [OPTION]... PATTERN FILE...
# Syntax Warning: Invalid Font Weight
# Syntax Warning: Invalid Font Weight

일치하는 항목이 있으면 특정 PDF 페이지로 빠르게 이동할 수 있는 방법을 찾고 싶습니다. 그러나 그러한 기능이 존재한다는 증거는 찾지 못했습니다.

운영 체제: Debian 8.5
Linux 커널: 4.6 백포트
하드웨어: Asus Zenbook UX303UA
Poppler-utils: pdftotext

답변1

그냥 직접 사용하십시오 pdfgrep.

pdfgrep -n therapy *.pdf

-n옵션은 각 게임의 페이지 번호를 표시합니다.

답변2

이것을 시도해 볼 수 있습니다.

pdfgrep therapy *.pdf

또는

find /tmp -name '*.pdf' -exec pdfgrep test {} +

예를 들어;

user@host $ pdfgrep test *.pdf 
1.pdf:test1
1.pdf:test2
1.pdf:test3
2.pdf:test1
2.pdf:test2
2.pdf:test3
test (copy).pdf:test1
test (copy).pdf:test2
test (copy).pdf:test3


user@host $ find /tmp -name '*.pdf' -exec pdfgrep test {} +
/tmp/test (copy).pdf:test1
/tmp/test (copy).pdf:test2
/tmp/test (copy).pdf:test3
/tmp/1.pdf:test1
/tmp/1.pdf:test2
/tmp/1.pdf:test3
/tmp/2.pdf:test1
/tmp/2.pdf:test2
/tmp/2.pdf:test3

관련 정보