2,500만 줄의 텍스트 파일(도메인 이름 목록)이 있습니다.
.co.uk
다른 txt 파일이 포함된 도메인을 추출하는 방법은 무엇입니까 ?
답변1
다음과 같은 파일이 제공됩니다.
foo.co.uk
bar.co.uk
baz.foo.bar
사용 명령:
grep "\.co\.uk$" file
산출:
foo.co.uk
bar.co.uk
답변2
이 시도:
grep -F '.co.uk' file > filtered_file
-F
특히 2,500만 개의 행이 있다는 점을 고려하면 패턴 대신 고정 문자열을 검색해 보겠습니다 grep
. 그러면 속도가 더 빨라집니다. 그러면 이스케이프 포인트도 필요하지 않습니다. 이스케이프 포인트는 패턴의 특수 문자입니다.
example.co.uk.com
이는 또는 와 유사한 줄 도 찾습니다 example.co.uk/index.html
. 항상 꼴찌가 되고 싶다면 .co.uk
가세요이것답변.