나는 이 데이터를 가지고 있으며 이를 만들기 위해 각 웹사이트에서 확장된 URL을 제거해야 합니다. 이전에는 ^.+?(?=.com )
선행 문자를 제거하는 데 사용했습니다. 이번에는 다음 단어를 삭제해야 합니다 .com
.
예를 들어:
https://myamcap.com/calem-atkins/
그러면 그것은 될 것이다
https://myamcap.com/
미리 감사드립니다.
답변1
그러면 URL의 첫 번째 부분만 가져옵니다.
grep -Po '^(.*://[^/]+)/' textfile