매우 긴 웹사이트 PDF가 있다고 가정해 보겠습니다. 좀 더 읽은 후 거기에 관련 없는 페이지가 있다는 것을 알았지만 페이지를 삭제하기로 결정할 때마다 웹사이트를 찾을 필요가 없고 페이지를 선택하는 대신 PDF로 인쇄하고 싶습니다. 인쇄(CUPS-PDF 사용). 특히 이 작업을 여러 번 수행하면 PDF 품질이 저하됩니까? 내가 찾고 있는 것을 달성할 수 있는 더 좋은 방법이 있습니까? 나는 혼합된 결과로 PDFEdit을 시도했으며 더 안정적인 것을 원했습니다. 물론, 원하지 않는 페이지를 무시하는 동일한 기술을 사용하여 언제든지 사이트로 돌아가 새 버전을 저장할 수 있습니다.
답변1
원칙적으로 특정 프로그램 체인을 통해 PDF를 인쇄하면 품질 저하 없이 PDF를 인쇄할 수 있습니다.
인지적으로 무손실 변환을 보장하려면 다음 두 가지 일이 발생해야 합니다.
체인의 각 링크는 모든 문서 요소를 이해하고 이를 체인의 다음 부분으로 손실 없이 전달할 수 있어야 합니다.
문서에 포함된 글꼴이 포함되어 있는 경우 다시 포함할 수 있도록 PDF 작성자가 찾을 수 있는 곳에 글꼴도 설치해야 합니다. 그렇지 않으면 포함된 글꼴이 어떤 방식으로든 체인을 통과해야 합니다.
문서에 포함된 애플릿(JavaScript, Flash, Postscript...)이 포함된 경우 해당 애플릿은 그대로 전달되어야 합니다.
문서에 하이퍼링크, 활성 양식, OCR 텍스트 레이어, 사용자 정의 페이지 번호, 인쇄되지 않는 표시, 설명, 메타데이터 등이 포함되어 있는 경우 체인의 모든 부분은 이 데이터를 작성자에게 전달하는 방법을 알아야 합니다.
문서에 혼합된 페이지 크기가 포함되어 있는 경우 체인의 프로그램도 이 트릭을 구현할 수 있어야 합니다.
체인의 어떤 링크도 이를 통과하는 데이터를 재해석할 수 없습니다. 예를 들어 PDF 체인에서는 이미지를 리샘플링하여 보다 효율적인 손실 형식으로 변환하는 것이 일반적입니다. 원본 PDF의 이미지가 이미 낮은 DPI JPEG인 경우에도 체인의 여러 부분에서 다른 DPI를 선택하거나 압축 수준 설정이 다를 수 있습니다.
(그런데 PDF-PDF 체인의 한쪽 또는 양쪽 끝에 기술적으로 JPEG가 있다는 사실은 원본 JPEG 데이터가 그대로 전달되지 않는 한 체인이 무손실이 아니라는 것을 의미합니다. 그러나 압축 단계는 다음과 같을 수 있습니다. 지각적으로는 무손실이지만 항상 그런 것은 아니지만 때로는 의도적인 경우도 있습니다.
지금까지 나는 인지된 품질만을 고려했습니다. 인지적으로 무손실 변환이 가능하지만 편집 가능성을 잃거나 더 큰 파일로 끝나게 됩니다.
기본 소스(즉, 다른 문서 표시 형식에서 스캔하거나 변환하지 않은)에서 생성된 텍스트를 포함하는 PDF 문서에는 일반적으로 PDF 리더가 워드 프로세서처럼 화면에 텍스트를 그릴 수 있도록 하는 실제 텍스트와 글꼴 데이터가 포함되어 있습니다.
이러한 텍스트는 인지적으로 무손실 방식으로 2D 래스터 또는 벡터 아트로 변환될 수 있습니다. PDF에서는 인쇄되지 않는 OCR 텍스트 레이어를 사용하여 검색 가능성과 화면 판독기 접근성을 유지할 수도 있습니다. 그러나 이러한 변환은 파일 크기를 늘리고 편집을 더욱 어렵게 만듭니다.
벡터 아트는 인쇄/보기 DPI와 같거나 그 배수인 DPI를 사용하여 래스터화할 수 있습니다.
이 체인은 이미지 품질의 손실 없이 모든 JPEG를 TIFF로 변환합니다.
체인에는 DPI를 변경하지 않고 높은 고정 품질 설정을 사용하여 눈에 띄는 아티팩트를 방지하는 JPEG에서 JPEG로의 작업이 포함될 수 있습니다.
페이지를 삭제하는 간단한 경우에는 PDF 파일 형식을 잘 이해하는 프로그램을 사용하여 페이지 데이터를 삭제하기만 하면 손실 없는 보장을 받는 것이 상당히 쉽습니다. PDF의 페이지는 다소 독립적이기 때문에 이는 전적으로 가능합니다. 기존 파일이 인코딩된 특정 PDF 변형에 대해 충분히 알고 있는 도구를 찾는 것뿐입니다. PDF는 매우 복잡한 파일 형식이므로 PDF를 지원한다고 주장하는 프로그램이 실제로는 부분적인 지원만 제공하는 경우가 많습니다. PDF를 100% 이해하는 프로그램은 Adobe Acrobat Pro뿐입니다. 나는 PDF를 처리하는 다른 모든 프로그램이 실제로 하위 집합이라는 사실을 알고 놀라지 않았습니다.
결론은 PDF에서 인쇄를 통한 PDF 체인이 그러한 품질 보증을 제공할 것으로 기대하지 않는다는 것입니다. 해석과 중재의 기회가 너무 많습니다.
답변2
귀하의 주요 목표를 올바르게 이해했다면 PDF로 인쇄하는 데 문제가 필요하지 않습니다. 다음과 같은 명령줄 도구를 사용할 수 있습니다.pdftk
PDF 파일에서 직접 페이지 세트를 추출하여 새 페이지로 저장하세요. (최적화, 비밀번호 추가/제거, 특정 페이지 회전 등과 같은 더 많은 작업도 가능합니다.) 이 도구는 (아마도) 모든 데스크톱 Linux 배포판의 패키지 저장소에서 사용할 수 있습니다.
사용할 주요 작업은 pdftk
다음과 같습니다.고양이. 이는 매우 직관적으로 작동합니다. 예를 들면 다음과 같습니다.
pdftk input_file.pdf cat 3-23 50-end output output_file.pdf
output_file.pdf
원본 파일의 3~23페이지와 50페이지부터 끝까지 구성된 파일이 생성됩니다 input_file.pdf
. 더 많은 예제를 참조하세요 man pdftk
(설명서 끝부분).
답변3
일반적으로 말하면 품질 손실이 발생해서는 안 됩니다. 그렇다면 형식이 아니라 프로그램을 비난하십시오. 발생할 수 있는 일부 상황은 품질 저하로 간주될 수 있습니다.
- 이미지가 다시 압축될 수 있습니다(빌드 손실이 발생할 수 있음).
- 텍스트(및 기타 벡터)가 스플라인이 되어 사용성 문제(텍스트를 복사할 수 없음) 등을 일으킬 수 있습니다.
저는 CUPS-PDF
or 를 사용한 적이 없습니다 PDFEdit
. 따라서 이것은 일어날 수 있는 일에 대한 가정일 뿐입니다. 즉, 그런 일이 일어날 가능성이 있는지는 알 수 없습니다.