awk 또는 sed를 사용하여 하위 도메인 삭제

Question 1

첫 번째 하위 도메인을 삭제하려면 다음 단계를 따르세요.

cut -d . -f 2- input

여러 수준의 하위 도메인이 있는 경우 조합을 사용하여 도메인의 마지막 두 요소를 보존 sub2.sub1.domain.com할 수 있습니다 .cutrev

rev input | cut -d . -f -2 |  rev

Answer

첫 번째 하위 도메인을 삭제하려면 다음 단계를 따르세요.

cut -d . -f 2- input

여러 수준의 하위 도메인이 있는 경우 조합을 사용하여 도메인의 마지막 두 요소를 보존 sub2.sub1.domain.com할 수 있습니다 .cutrev

rev input | cut -d . -f -2 |  rev

Question 2

견본

www.google.com
prep.ai.mit.edu

마지막 두 개의 최상위 도메인을 유지하고,

사용sed

sed 's/.*\.\(.*\..*\)/\1/'

어디

사용(gnu)grep

grep -Eo '[^.]*.[^.]*$' data
google.com
mit.edu

첫 번째 하위 도메인 제거, 사용 sed(정보 유지, 사양 변경됨)

sed -e 's/^[^.]*\.//' data
google.com
ai.mit.edu

어디

Answer

견본

www.google.com
prep.ai.mit.edu

마지막 두 개의 최상위 도메인을 유지하고,

사용sed

sed 's/.*\.\(.*\..*\)/\1/'

어디

사용(gnu)grep

grep -Eo '[^.]*.[^.]*$' data
google.com
mit.edu

첫 번째 하위 도메인 제거, 사용 sed(정보 유지, 사양 변경됨)

sed -e 's/^[^.]*\.//' data
google.com
ai.mit.edu

어디

Question 3

.해당 필드가 행의 구분된 마지막 두 필드가 될 것으로 판단되면 다음을 사용할 수 있습니다.

$ awk -F. -v OFS='.' '{print $(NF-1),$NF}' file
stackexchange.com
example.org
example.tld

또는 sed:

$ sed 's/.*\.\([^.]*\..*\)$/\1/' file
stackexchange.com
example.org
example.tld

그리고 sed지원 한다면 -E약간 더 깔끔해집니다.

 sed -E 's/.*\.([^.]*\..*)$/\1/' file
stackexchange.com
example.org
example.tld

Answer

.해당 필드가 행의 구분된 마지막 두 필드가 될 것으로 판단되면 다음을 사용할 수 있습니다.

$ awk -F. -v OFS='.' '{print $(NF-1),$NF}' file
stackexchange.com
example.org
example.tld

또는 sed:

$ sed 's/.*\.\([^.]*\..*\)$/\1/' file
stackexchange.com
example.org
example.tld

그리고 sed지원 한다면 -E약간 더 깔끔해집니다.

 sed -E 's/.*\.([^.]*\..*)$/\1/' file
stackexchange.com
example.org
example.tld

Question 4

기준을 사용하여 sed마지막 및 마지막에서 두 번째 구성 요소를 제외한 모든 구성 요소를 제거합니다 .

sed 's/.*\.\(.*\..*\)/\1/'

불행하게도 이 정규 표현식은 폭풍우 이후의 숲처럼 보입니다. 단계별로 구축해 봅시다:

시각적 설명:

subdomain.domain.tld
sub1.sub2.domain.tld
`--v----´ `-v--´ `v´
   .*   \.  .* \. .*

Answer

기준을 사용하여 sed마지막 및 마지막에서 두 번째 구성 요소를 제외한 모든 구성 요소를 제거합니다 .

sed 's/.*\.\(.*\..*\)/\1/'

불행하게도 이 정규 표현식은 폭풍우 이후의 숲처럼 보입니다. 단계별로 구축해 봅시다:

시각적 설명:

subdomain.domain.tld
sub1.sub2.domain.tld
`--v----´ `-v--´ `v´
   .*   \.  .* \. .*

관련 정보