스크립트를 통해 웹페이지와 상호작용하시나요?

스크립트를 통해 웹페이지와 상호작용하시나요?

이메일 계정이 있는데 드디어 받았어요많은스팸 폴더에 (200,000)개의 메시지가 있습니다. 불행하게도 이것이 모두 스팸은 아닙니다. 부분적으로는 필터가 제대로 훈련되지 않았기 때문이고, 부분적으로는 메일링 리스트 다이제스트에 필터를 작동시키는 많은 메시지 중 하나 또는 두 개가 포함되어 있기 때문입니다.

이러한 이메일을 다운로드하고 싶지만 이메일의 양이 많기 때문에 POP는 INBOX 및 IMAP을 제외한 모든 폴더에 액세스할 수 없습니다(서버 충돌).

메시지를 스팸에서 받은 편지함으로 이동하려면 웹메일을 사용해야 했습니다. "페이지가 로드될 때까지 대기", "모든 메시지에 플래그 지정", "받은 편지함 선택", "플래그된 메시지를 선택한 폴더로 이동" 등을 수행했습니다. .. ...그리고 반복합니다! 하지만 페이지당 메시지 수가 500~1,000개에 불과하므로 100,000개의 메시지를 이동하려면 많은 작업이 필요합니다.

이것을 자동화하는 좋은 방법이 있습니까?

또는 expect과 함께 사용하려고 생각했지만 웹메일 인터페이스는 일부 JavaScript를 사용하므로 제대로 작동할지 의심스럽습니다... (내가 아는 한) 이와 같은 작업에는 적합하지 않습니다... "원격 제어"할 수 있는 방법이 있습니까 , 아니면 (또는 그 자체) 스크립트를 통해? lynxlinkswgetchromefirefoxoperaX

내가 정말로 찾고 있는 것은 (제 생각에) 일반 웹 브라우저처럼 작동하지만 스크립트에 의해 제어되는 일종의 "가상 웹 브라우저"입니다.

답변1

웹 인터페이스가 자바스크립트를 사용하고 자바스크립트 없이는 실행할 수 없는 경우 다음을 사용해야 합니다.셀렌선택한 프로그래밍 언어를 직접 사용하거나 Python을 사용하는 경우 추상화 계층을 사용할 수도 있습니다.파편.

실행하기 위해 JavaScript가 필요하지만 JavaScript가 전혀 필요하지 않은 웹 사이트는 점점 더 흔해지고 있습니다. 그러나 브라우저에서 JavaScript를 일시적으로 끄면 쉽게 확인할 수 있습니다. 자바스크립트는 필요하지 않지만 쿠키가 필요한 경우 셀레늄과 같은 덜 무거운 메커니즘을 사용할 수 있습니다(예: Python +기계화. URL 외에도 일반적으로 로그인에서 요청까지, 요청에서 요청까지 쿠키를 처리해야 하는데, 이는 셀레늄(및 기계화)에서는 사소하지만 wget사용할 때는 쉽지 않습니다.

또 다른 방법은 문제 없이 받은 편지함을 다운로드할 수 있는 경우 받은 편지함의 메시지를 임시 저장소로 이동하고 모든 스팸 폴더 내용을 받은 편지함으로 옮긴 다음 받은 편지함을 다운로드하고 지우고 받은 편지함 임시 저장소를 복원하는 것입니다. 그것에서.

관련 정보