웹사이트에서 정보를 수집하여 텍스트 파일로 출력하는 스크립트가 있습니다. 사이트를 다운로드한 다음 grep을 사용하여 정보를 추출합니다. 내가 원하는 대로 출력하려면 서식을 사용해야 합니다.
#!/usr/bin/env bash
echo Enter an url
read url
mkdir site
cd site
wget -r -l1 --follow-tags=a --no-check-certificate $url
grep -r -E -o -H "\b[a-zA-Z0-9.-]+@[a-zA-Z0-9.-]+\.[a-zA-Z0-9.-]+\b" * | sort -u >> ~/email.txt
grep -r -E -o -H "\(?[[:digit:]]{5}\)?[[:space:]]?[[:digit:]]{6}" * | sort -u >> ~/phone.txt
cd ..
rm -rf site
이것을 실행하면 다음과 같은 결과가 나타납니다.
www.example.com/en/contact:91112223334
...
www.example.com/en/contact:[email protected]
테이블 형식으로 만들고 싶습니다.
이메일.txt
URL | 이메일 |
---|---|
www.example.com | [이메일 보호됨] |
전화.txt
URL | 전화 |
---|---|
www.example.com | 0 111 222 33 34 |
표에 표시된 대로 전화번호 형식을 지정해야 합니다. awk를 사용해 보았지만 성공하지 못했습니다.