PDF에서 수학 내용을 파악하는 방법은 무엇입니까?

PDF에서 수학 내용을 파악하는 방법은 무엇입니까?

2의 n승과 같이 수학적 "2^n"을 찾기 위해 PDF 문서(원래 LaTeX로 작성됨)를 grep할 수 있는 방법이 있습니까? pdfgrep이 있지만 수학 계산을 위해 grep을 사용하는 방법을 모르겠습니다.

답변1

mutool clean -d예를 들어 from the package를 사용하여 mupdfPDF 파일에서 스트림의 압축을 풀고 이를 볼 수 있습니다(또는 grep직접 볼 수 있습니다).

안타깝게도 PDF 파일의 텍스트는 미리 계산된 좌표에 문자 모양(또는 문자 시퀀스)을 배치하여 렌더링됩니다. 따라서 $2^n$및 둘 다 $$2^n$$서로 다른 위치에 있는 2두 개의 am 문자 모양으로 구성됩니다 n. 이는 정규 표현식과 일치시키기가 정말 어렵습니다.

PDF 문서의 압축을 풀고 실제 텍스트 렌더링을 확인하는 것이 좋습니다.

관련 정보