wget을 사용하여 웹 페이지 내에서 참조되는 이메일 주소를 다운로드하는 방법은 무엇입니까? [폐쇄]

wget을 사용하여 웹 페이지 내에서 참조되는 이메일 주소를 다운로드하는 방법은 무엇입니까? [폐쇄]

웹사이트에서 웹페이지에 제공된 이메일 주소를 어떻게 다운로드하나요?

상위 페이지, 하위 페이지 등 사이트의 모든 페이지를 스캔해야 합니다. 목표는 웹사이트의 여러 페이지에서 참조되는 다양한 이메일 주소를 얻는 것입니다.

웹사이트에는 robots.txt 파일도 있습니다.

답변1

원하는만큼 간단하지 않습니다.

wget웹메일 인터페이스에서 이메일을 다운로드할 수도 있습니다. 이 인터페이스는 브라우저가 할 수 있는 정교한 기능을 많이 사용하지만 wget은 할 수 없습니다(또는 극단적인 스크립팅으로만 할 수 있습니다).

그러나 대부분의 웹메일은 MAP 또는 POP도 지원하므로 이 작업을 비교적 쉽게 수행할 수 있습니다.

이렇게 하지 않으면 with 를 사용하세요 wget. 예를 들어, with 를 사용하세요.셀렌구성이 상대적으로 복잡하고 더 많은 리소스를 소비하지만 실제 브라우저를 자동화할 수 있습니다. 기본적으로 프로그래밍을 해야 합니다.

귀하의 경우에는 POP3/IMAP 방향으로 가는 것이 좋습니다.

관련 정보