ocr bash 스크립트를 사용하여 스캔하는 방법

Question 1

임시 디렉터리를 만들고 여기에 파일을 저장할 수 있습니다. mktemp고유한 파일/디렉토리 이름을 제공하도록 설계되었으며 이러한 목적에 적합합니다.

tmpdir=$(mktemp -d OcrTmpDirXXXXXXXXX)

scanimage args >"$tmpdir/in.pdf"
ocrmypdf args "$tmpdir/in.pdf" "$tmpdir/out.pdf"

printf 'See "%s" for result\n' "$tmpdir"

Answer

임시 디렉터리를 만들고 여기에 파일을 저장할 수 있습니다. mktemp고유한 파일/디렉토리 이름을 제공하도록 설계되었으며 이러한 목적에 적합합니다.

tmpdir=$(mktemp -d OcrTmpDirXXXXXXXXX)

scanimage args >"$tmpdir/in.pdf"
ocrmypdf args "$tmpdir/in.pdf" "$tmpdir/out.pdf"

printf 'See "%s" for result\n' "$tmpdir"

Question 2

문제는

image="$(scanimage --device "brother4:net1;dev0" --progress --verbose --resolution=600 -l 0 -t 0 -x 210 -y 297 --format=pdf)"

$image변수에 다음이 포함되어 있다는 것입니다.바이너리 콘텐츠파일 이름이 아닌 PDF 이름입니다.

매우 까다로운 방법은 다음과 같습니다.프로세스 교체

ocrmypdf --deskew <(
    scanimage --device "brother4:net1;dev0" --progress --verbose --resolution=600 -l 0 -t 0 -x 210 -y 297 --format=pdf
) "$mydate".pdf

나는 ocrmypdf가 그것을 받아들일 것이라고 보장하지 않습니다.

ocrmypdf가 -"표준 입력"을 나타내는 파일 이름을 허용하는 경우 다음을 수행할 수 있습니다.

scanimage --device "brother4:net1;dev0" --progress --verbose --resolution=600 -l 0 -t 0 -x 210 -y 297 --format=pdf \
| ocrmypdf --deskew - "$mydate".pdf

아니면 이중 하이픈이 필요할 수도 있습니다. 이 도구가 어떻게 작동하는지 모르겠습니다(맨 페이지 확인).

... \
| ocrmypdf --deskew -- - "$mydate".pdf

Answer

문제는

image="$(scanimage --device "brother4:net1;dev0" --progress --verbose --resolution=600 -l 0 -t 0 -x 210 -y 297 --format=pdf)"