모든 파일에서 URL 주소를 선택하고 출력하는 방법은 무엇입니까? [복사]

모든 파일에서 URL 주소를 선택하고 출력하는 방법은 무엇입니까? [복사]

어떤 명령이 실행되는지 알고 싶습니다.

  1. 파일의 모든 URL을 선택하십시오(예: 처음부터 끝까지 http 또는 www로 시작하는 모든 주소를 식별하고 이를 텍스트 또는 기타 데이터와 분리하십시오).

  2. .txt 파일로 출력합니다.

다음 아이디어는 .txt 파일에서 wget -i를 수행하는 것입니다. wget이 원본 파일의 모든 URL을 직접 인식하는 데 어려움을 겪기 때문에 이러한 URL을 선택하고 .txt 파일에서 올바르게 출력해야 합니다.

답변1

나는 다음의 지시를 따랐다.grep을 사용하고 스크립트를 삽입하여 HTML 파일에서 웹사이트 URL을 얻는 방법내 경우에는 URL이 입력 파일의 <href> 사이에 있었기 때문에 잘 작동했습니다.

grep -Po '(?<=href=")[^"]*(?=")' INPUT_FILE > OUTPUT_FILE.txt

관련 정보