PDF 파일 세트에서 단어 또는 단어 그룹 찾기

Question 1

바꾸다

for i in 1 2 3 4 5 6 7 8; do  find Semaine_$i -iname '*.pdf' -exec pdfgrep "taux" {} +; done

파일 이름을 인쇄하려면 find에서 -print(일치 후 이름 인쇄)를 사용하거나 grep에서 -l(일치 대신 이름 인쇄)을 사용하세요.

find Semaine_[1-8] -iname '*.pdf' -exec pdfgrep "taux" {} \; -print

또는

find Semaine_[1-8] -iname '*.pdf' -exec pdfgrep -l "taux" {} \;

또한 pdfgrep전달 플래그에는 재귀 기능이 내장되어 있으므로 -r간단히 다음을 수행할 수 있습니다.

pdfgrep -r -l "taux" Semaine_[1-8]

Answer

바꾸다

for i in 1 2 3 4 5 6 7 8; do  find Semaine_$i -iname '*.pdf' -exec pdfgrep "taux" {} +; done

파일 이름을 인쇄하려면 find에서 -print(일치 후 이름 인쇄)를 사용하거나 grep에서 -l(일치 대신 이름 인쇄)을 사용하세요.

find Semaine_[1-8] -iname '*.pdf' -exec pdfgrep "taux" {} \; -print

또는

find Semaine_[1-8] -iname '*.pdf' -exec pdfgrep -l "taux" {} \;

또한 pdfgrep전달 플래그에는 재귀 기능이 내장되어 있으므로 -r간단히 다음을 수행할 수 있습니다.

pdfgrep -r -l "taux" Semaine_[1-8]

Question 2

grep 명령을 직접 사용해도 결과가 나오지 않습니다. Linux Minimal 패키지에 포함된 애플리케이션은 vi와 nano가 읽을 수 있는 파일만 처리할 수 있기 때문입니다. (grep, awk 등) PDF와 같은 특수 파일 형식을 위한 다양한 도구와 대안이 있습니다. Dspace와 같은 오픈 소스 보관 소프트웨어를 설치하면 브라우저에서 모든 PDF를 검색하고 카탈로그화할 수 있습니다. 모듈을 추가하면 PDF 작업이 향상될 수 있습니다. 또는 명령줄 기반 응용 프로그램을 사용하여 PDF 파일을 pdftotext와 같은 일반 텍스트 파일로 변환할 수 있습니다. pdftotext에 대한 검색 명령의 예:

pdftotext /file/semaine.pdf - | grep -n -i "Semaine"

-N:줄 번호를 인쇄합니다. -나:대문자와 소문자는 구별되지 않습니다.

wc -l명령 끝에 추가하여 찾고 있는 용어가 몇 번이나 나타나는지 확인할 수 있습니다.

awk와 파이프라인 뒤에 추가된 파생 매개변수를 사용하면 보다 효율적인 결과를 얻을 수 있습니다.

위에서 언급했듯이 여러 가지 방법이 있습니다. 나는 이 두 가지 다른 옵션을 제안할 수 있습니다.

Answer