2의 n승과 같이 수학적 "2^n"을 찾기 위해 PDF 문서(원래 LaTeX로 작성됨)를 grep할 수 있는 방법이 있습니까? pdfgrep이 있지만 수학 계산을 위해 grep을 사용하는 방법을 모르겠습니다.
답변1
mutool clean -d
예를 들어 from the package를 사용하여 mupdf
PDF 파일에서 스트림의 압축을 풀고 이를 볼 수 있습니다(또는 grep
직접 볼 수 있습니다).
안타깝게도 PDF 파일의 텍스트는 미리 계산된 좌표에 문자 모양(또는 문자 시퀀스)을 배치하여 렌더링됩니다. 따라서 $2^n$
및 둘 다 $$2^n$$
서로 다른 위치에 있는 2
두 개의 am 문자 모양으로 구성됩니다 n
. 이는 정규 표현식과 일치시키기가 정말 어렵습니다.
PDF 문서의 압축을 풀고 실제 텍스트 렌더링을 확인하는 것이 좋습니다.