기술 서적이 많아서 한동안 사용해 왔지만 pdfgrep
, 다 검색하려면 시간이 많이 걸립니다.
PDF 파일을 매우 빠르게 검색할 수 있는 CLI 도구를 추천해 줄 수 있는 사람이 있나요?
캐싱 목적을 위한 밑줄 데이터베이스가 있어야 합니다. locate
명령과 유사하지만 pdf 키워드에만 해당됩니다.
다들 감사 해요! :)
답변1
대안으로pdfgrep
당신은 그것을 사용할 수 있습니다rga
.
rga
재귀 검색은 기본적으로 캐싱이 활성화된 상태에서 수행됩니다.
SSD에 저장된 15GB PDF 컬렉션과 빠르게 비교했습니다.
$ gtime --format "%Es" pdfgrep --recursive --cache --ignore-case conclusion
2:15:26s # initial run
3:05.30s # with cache
$ gtime --format "%Es" rga --type pdf conclusion
33:26.96s # initial run
1:18.70s # with cache
$ gdu -sh --apparent-size ~/.cache/pdfgrep
697M /Users/sschmidt/.cache/pdfgrep
$ gdu -sh --apparent-size ~/Library/Caches/rga
186M /Users/sschmidt/Library/Caches/rga
따라서 rga
초기 실행보다 약 4배 빠르며 캐시된 실행에서는 약 2배 빠릅니다. pdfgrep
게다가 rga
캐시 pdfgrep
크기는 약 4분의 1에 불과합니다. 물론 이는 내 특정 설정일 뿐이므로 구성에 따라 결과가 달라질 수 있습니다.