나는 qpdf를 사용했다
qpdf --qdf --object-streams=disable orig.pdf expanded.pdf
참조https://unix.stackexchange.com/a/109177/306249
텍스트 편집기에서 모든 개체를 볼 수 있습니다. 하지만 PDF의 텍스트를 볼 수 없습니다.
PDF의 "Hello world" 텍스트를 사용하여 테스트했습니다. 하지만 압축을 푼 후에는 이 텍스트를 볼 수 없습니다.
개체와 함께 텍스트를 보는 방법은 무엇입니까?
답변1
모든 개체를 확장한 후에도 텍스트(문자열 및 단일 문자)는 ASCII로 표시할 필요가 없으며 16진수로 인코딩될 수 있습니다.
텍스트를 찾으려면 다음 단계를 따르세요.
확장된 PDF에서 이름이 인 모든 키를 찾으세요
/Contents
. 다음과 같이 보일 수 있습니다:/Contents 8 0 R
이는 해당 페이지의 내용이 객체 번호 8에 위치함을 알려줍니다.
개체 번호 8로 이동합니다. 이는 문자열을 검색하여 찾을 수 있습니다.
'8 0 obj'
stream ... endstream
아래 줄에서 줄 끝에 다음 중 하나가 표시되면 해당 줄로 묶습니다....
TJ
,Tj
,'
또는"
당신은운영자의 텍스트를 표시합니다.직장에서.
이전 줄에는 텍스트가 포함되어 있지만 다음과 같을 수 있습니다.
[(H)0.0976563(e)0.0976563(l)-599.902(l)0.0976563(o)0.0976563(W)0.0976563(o)-599.902(r)0.0976563(l)0.0976563(d)0.0976563(!)]TJ
이봐, 당신은 행운을 빌어요! "Hello World!"를 해독할 수 있나요? 여기에 문자열이 있나요? 가운데 숫자는 그냥 각 캐릭터의 위치를 조절하는 것인데...
....이제 PDF 교육을 중단하겠습니다. 자세한 내용은 공식 PDF 형식 사양에서 읽어보실 수 있습니다 :-)
또 하나의 팁: 검색해 보면
StackOverflow에 대한 다른 PDF 관련 답변,PDF 코드를 읽는 방법을 자세히 설명하는 많은 예제를 찾을 수 있습니다.