PDF에서 단어 수를 찾는 명령줄 유틸리티가 있습니까?
PDF의 단어 수를 사용하여 읽는 데 걸리는 시간을 추정하겠습니다. Get the page count of the PDF 를 사용할 수 있지만 qpdf
한 페이지에 텍스트가 거의 또는 많이 포함될 수 있으므로 페이지 수는 책을 읽는 데 걸리는 시간에 대한 잘못된 추정입니다.
내 목표를 달성하기 위한 최악의 시나리오는 pandoc
PDF pdftotext
를 일반 텍스트로 변환한 다음 wc
단어와 문자 수를 계산하는 데 사용하는 것입니다. 하지만 나쁜 점은 PDF를 텍스트로 변환하는 데 시간이 걸리고 단지 단어 수를 세기 위해 쓸모없는 큰 텍스트 파일을 생성한다는 것입니다. PDF에는 수백 페이지가 포함될 수 있으므로 이 솔루션은 효율적이지 않습니다.