자동화된 작업 생성 PDF로 다운로드 및 검색하고 알림

자동화된 작업 생성 PDF로 다운로드 및 검색하고 알림

매시간 특정 URL에서 PDF를 다운로드한 다음 "6256896"과 같은 일부 텍스트를 검색한 다음 해당 텍스트가 PDF에 있으면 이메일 등을 통해 알려주는 자동화된 작업을 만들고 싶습니다.

프로그래밍 없이 이것이 가능합니까? 그렇다면 어떨까요?

답변1

이를 수행하기 위해 셸 스크립트를 사용할 수 있지만 최소한의 코드 몇 줄을 작성해야 하며 실제로는 스크립트이므로 일반적으로 터미널에 입력하는 복사/붙여넣기 명령과 비슷합니다. 파일을 다운로드하려면 wget을 사용할 수 있습니다. 그런 다음 PDF가 "깨끗하게 생성"되었다고 가정하면(예: .tex 소스 파일에서) pdftotext(우분투의 poppler-utils 패키지에서)와 같은 유틸리티를 사용하여 거의 모든 텍스트를 추출할 수 있으며 쉽게 사용할 수 있습니다. mail 명령은 메일을 보냅니다. 매시간 실행하려면 스크립트를 cron 작업으로 설정하면 됩니다.

#!/bin/sh

wget http://some_url.com/file.pdf
if [ pdftotext file.pdf - | grep 'pattern' ]
then
    mail -u your_user@localhost -s "pattern found inside file.pdf!"
fi

관련 정보