많은 PDF 파일에서 키워드를 매우 빠르게 검색할 수 있는 도구가 있습니까?

Question

대안으로pdfgrep당신은 그것을 사용할 수 있습니다rga.

rga재귀 검색은 기본적으로 캐싱이 활성화된 상태에서 수행됩니다.

SSD에 저장된 15GB PDF 컬렉션과 빠르게 비교했습니다.

$ gtime --format "%Es" pdfgrep --recursive --cache --ignore-case conclusion
2:15:26s # initial run
3:05.30s # with cache

$ gtime --format "%Es" rga --type pdf conclusion
33:26.96s # initial run
1:18.70s  # with cache

$ gdu -sh --apparent-size ~/.cache/pdfgrep
697M    /Users/sschmidt/.cache/pdfgrep

$ gdu -sh --apparent-size ~/Library/Caches/rga
186M    /Users/sschmidt/Library/Caches/rga

따라서 rga초기 실행보다 약 4배 빠르며 캐시된 실행에서는 약 2배 빠릅니다. pdfgrep게다가 rga캐시 pdfgrep크기는 약 4분의 1에 불과합니다. 물론 이는 내 특정 설정일 뿐이므로 구성에 따라 결과가 달라질 수 있습니다.

Answer 1

대안으로pdfgrep당신은 그것을 사용할 수 있습니다rga.

rga재귀 검색은 기본적으로 캐싱이 활성화된 상태에서 수행됩니다.

SSD에 저장된 15GB PDF 컬렉션과 빠르게 비교했습니다.

$ gtime --format "%Es" pdfgrep --recursive --cache --ignore-case conclusion
2:15:26s # initial run
3:05.30s # with cache

$ gtime --format "%Es" rga --type pdf conclusion
33:26.96s # initial run
1:18.70s  # with cache

$ gdu -sh --apparent-size ~/.cache/pdfgrep
697M    /Users/sschmidt/.cache/pdfgrep

$ gdu -sh --apparent-size ~/Library/Caches/rga
186M    /Users/sschmidt/Library/Caches/rga

따라서 rga초기 실행보다 약 4배 빠르며 캐시된 실행에서는 약 2배 빠릅니다. pdfgrep게다가 rga캐시 pdfgrep크기는 약 4분의 1에 불과합니다. 물론 이는 내 특정 설정일 뿐이므로 구성에 따라 결과가 달라질 수 있습니다.

많은 PDF 파일에서 키워드를 매우 빠르게 검색할 수 있는 도구가 있습니까?

답변1

관련 정보