djvu 파일의 각 페이지를 분할하는 방법은 무엇입니까?

djvu 파일의 각 페이지를 분할하는 방법은 무엇입니까?

djvu 파일에는 djvu 페이지에 두 개의 책 페이지가 있습니다. 각 djvu 페이지에 한 페이지가 있도록 분할하고 싶습니다. 예를 들어,여기에 이미지 설명을 입력하세요.

일부 소프트웨어(바람직하게는 명령줄 유틸리티)를 통해 이 작업을 수행할 수 있는지 궁금합니다. 감사드립니다!

추신: 이것은하나의 문서테스트용으로 사용할 수 있습니다.

답변1

다음은 테스트되지 않았지만 원칙적으로는 작동할 것입니다(시간이 더 있으면 테스트하겠습니다).

예를 들어 다음과 같이 djvu 파일을 jpg로 변환할 수 있습니다.

#!/bin/sh
# djvu -> jpgs converter

i=1

# number of pages (392)
while [ $i -ne 392 ]
do
ddjvu -page=$i -format=pnm 1.djvu $i.pnm
pnmtojpeg $i.pnm > $i.jpg
rm -f $i.pnm
echo "page $i done"
i=`expr $i + 1`
done

(에서http://caree.livejournal.com/74639.html)

그런 다음 사용할 수 있습니다스캔 재단사페이지를 분할하고 새 출력(tif 파일로 구성)을 생성합니다.

세 번째 단계는 신청하기입니다.djvbind해당 폴더로 이동하면 필요한 djvu 파일을 얻을 수 있습니다.

답변2

여기 내 완전한 작업 스크립트가 있습니다. djvulibre-bin라이브러리 ddjvu(tiff 형식으로 디코딩하려면), ( cjb2tiff를 djvu로 직접 변환하는 방법을 모르기 때문에), djvm(djvu 파일에 페이지를 삽입/제거하려면) 도구 및 imagemagick라이브러리 convert(페이지를 분할하고 암호로 변환하려면) pbm 파일 형식) 도구. 모든 도서관이 통과할 수 있습니다 apt-get.

계획:

file.djvu --./ddjvu--> 이중 접기 tiff --./convert--> 단일 페이지 tiff --./convert--> pbm --./djvm--> out.djvu

예: djvusplit 3 10 file.djvu이는 을 의미합니다 split pages from 3 to 10.

전체 코드:

#!/bin/bash
echo Usage: djvusplit PAGEFROM PAGETO FILE.DJVU

#make temp folder
mkdir ./tmp
cp "$3" ./tmp/
cd tmp

for i in $(seq -w $2 -1 $1) # Descending
do
    ddjvu -format=tiff -page=$i "$3" t$i.tiff
    convert -crop 2x1@ t$i.tiff t$i-%d.tiff
    convert t$i-0.tiff t$i-0.pbm
    convert t$i-1.tiff t$i-1.pbm
    cjb2 t$i-0.pbm t$i-0.djvu
    cjb2 t$i-1.pbm t$i-1.djvu
    djvm -i t$i-0.djvu t$i-1.djvu 2
    djvm -d $3 $i
    djvm -i $3 t$i-0.djvu $i
    rm ./t*
done

# total clean
mv $3 ../out.djvu
cd ..
rm -r ./tmp

안타깝게도...

  1. 생성된 많은 tiff/pbm/djvu 파일로 인해 매우 느리게 실행됩니다.
  2. 페이지를 분할하면 모든 OCR 텍스트가 손실됩니다.

나는 이 스크립트와 다른 몇 가지 스크립트를 사용하여 전자 라이브러리를 유지 관리합니다. 그들이 그걸 찾았어여기GitHub에서.

답변3

PDF 또는 JPEG와 같은 다른 일반적인 형식과 비교할 때 DjVu 파일을 직접 조작할 수 있는 도구는 많지 않습니다. 이미지 조작 프로그램의 경우 추가 장애물이 있습니다. 이러한 프로그램의 대부분은 한 번에 하나의 이미지에서만 작동할 수 있지만 DjVu 파일에는 여러 페이지가 포함되어 있습니다.

한 가지 가능성은 PDF를 통해 보는 것입니다. ddjvu팔로우프리랜서 DJ,PDF un2up필터, 그리고pdf2djvu:

ddjvu -format=pdf 2up.djvu 2up.pdf
un2up <2up.pdf | pdf2djvu /dev/stdin >1up.djvu

나에게서 영감을 받아 djvu를 위한 un2up을 함께 엮을 수도 있습니다.PDF 버전사용파이썬-djvulibre. API가 얼마나 어려운지 확인하지 않았습니다.

답변4

http://en.wikisource.org/wiki/Help:DjVu_files#Splitting_DjVu_files

여기서 답을 찾으시기 바랍니다.

관련 정보