소스 코드에서 도메인 이름을 철저하게 추출합니다.

소스 코드에서 도메인 이름을 철저하게 추출합니다.

도메인 이름을 추출하기 위해 bash 스크립트를 검색해 왔으며 이를 사용하기 위한 몇 가지 팁을 찾았지만 특정 grepTLD나 ..comgoogle([A-Za-z\-]*?\\*?)\.com

다른 오픈소스 프로젝트에 의존하는 프로젝트를 진행하고 있는데 보안상의 이유로 소스코드에 있는 모든 도메인 이름을 철저하게 검색하고 추출하고 싶습니다.

나는 다음과 같은 것을 사용하고 싶습니다 :https://publicsuffix.org/list/public_suffix_list.dat, 모든 공개 최상위 도메인 목록인 을 입력한 후, 모든 도메인과 일치하는 전체 소스 코드에서 검색 및 추출합니다.public_suffix_list.dat

폴리스티렌

  • public_suffix_list.dat주석이 달린 줄이 있지만 이를 제거하고 TLS 목록을 떠나는 것은 쉽습니다.
  • 소스 코드의 경우 전체 소스 코드를 반복적으로 반복하는 데 비용이 너무 많이 든다면 파일을 완전히 완성해도 괜찮습니다. 파일 목록을 생성하여 하나씩 완성할 수 있습니다.

bash 스크립트로 이것이 가능합니까? 감사합니다!

관련 정보