![wget을 사용하여 웹 페이지 내에서 참조되는 이메일 주소를 다운로드하는 방법은 무엇입니까? [폐쇄]](https://linux55.com/image/118768/wget%EC%9D%84%20%EC%82%AC%EC%9A%A9%ED%95%98%EC%97%AC%20%EC%9B%B9%20%ED%8E%98%EC%9D%B4%EC%A7%80%20%EB%82%B4%EC%97%90%EC%84%9C%20%EC%B0%B8%EC%A1%B0%EB%90%98%EB%8A%94%20%EC%9D%B4%EB%A9%94%EC%9D%BC%20%EC%A3%BC%EC%86%8C%EB%A5%BC%20%EB%8B%A4%EC%9A%B4%EB%A1%9C%EB%93%9C%ED%95%98%EB%8A%94%20%EB%B0%A9%EB%B2%95%EC%9D%80%20%EB%AC%B4%EC%97%87%EC%9E%85%EB%8B%88%EA%B9%8C%3F%20%5B%ED%8F%90%EC%87%84%5D.png)
웹사이트에서 웹페이지에 제공된 이메일 주소를 어떻게 다운로드하나요?
상위 페이지, 하위 페이지 등 사이트의 모든 페이지를 스캔해야 합니다. 목표는 웹사이트의 여러 페이지에서 참조되는 다양한 이메일 주소를 얻는 것입니다.
웹사이트에는 robots.txt 파일도 있습니다.
답변1
원하는만큼 간단하지 않습니다.
wget
웹메일 인터페이스에서 이메일을 다운로드할 수도 있습니다. 이 인터페이스는 브라우저가 할 수 있는 정교한 기능을 많이 사용하지만 wget은 할 수 없습니다(또는 극단적인 스크립팅으로만 할 수 있습니다).
그러나 대부분의 웹메일은 MAP 또는 POP도 지원하므로 이 작업을 비교적 쉽게 수행할 수 있습니다.
이렇게 하지 않으면 with 를 사용하세요 wget
. 예를 들어, with 를 사용하세요.셀렌구성이 상대적으로 복잡하고 더 많은 리소스를 소비하지만 실제 브라우저를 자동화할 수 있습니다. 기본적으로 프로그래밍을 해야 합니다.
귀하의 경우에는 POP3/IMAP 방향으로 가는 것이 좋습니다.