sed AWK를 사용하여 시작 패턴과 끝 패턴 사이의 문자열을 추출하는 방법은 무엇입니까?

Question 1

각 줄은 <span>다음으로 시작하고 끝납니다 </span>.

sed 's|<span>\(.*\)</span>|\1|' domain.txt

awk필드 구분 기호를 <또는 로 설정하고 세 번째 열을 인쇄하여 >이를 수행 할 수도 있습니다.

awk -F '[<>]' '{print $3}' domain.txt

산출:

aghahan.com
pouyamannequin.com

이것은 가장 간단한 방법이며 줄 끝에 공백이 있는 경우에도 작동합니다.

Answer

각 줄은 <span>다음으로 시작하고 끝납니다 </span>.

sed 's|<span>\(.*\)</span>|\1|' domain.txt

awk필드 구분 기호를 <또는 로 설정하고 세 번째 열을 인쇄하여 >이를 수행 할 수도 있습니다.

awk -F '[<>]' '{print $3}' domain.txt

산출:

aghahan.com
pouyamannequin.com

이것은 가장 간단한 방법이며 줄 끝에 공백이 있는 경우에도 작동합니다.

Question 2

그리고sed

 sed 's/\(.*\)>\(.*\)<\(.*\)/\2/g' domain.txt

Answer

그리고sed

 sed 's/\(.*\)>\(.*\)<\(.*\)/\2/g' domain.txt

Question 3

그리고 :pythonBeautifulSoup

python -c '
from bs4 import BeautifulSoup
f = open("domain.txt", "r")
soup = BeautifulSoup(f.read(),"html.parser")
for span in soup.find_all("span"):
  print(span.string)
'

간단한 작업에는 약간 과잉일 수 있지만 예를 들어 다음과 같은 다른 HTML이 있는 경우 더 어려운 작업에서는 더 잘 작동하고 더 쉬울 것입니다.

<span>
 aghahan.com
</span>
<span>
 pouyamannequin.com
</span>

Answer

그리고 :pythonBeautifulSoup

python -c '
from bs4 import BeautifulSoup
f = open("domain.txt", "r")
soup = BeautifulSoup(f.read(),"html.parser")
for span in soup.find_all("span"):
  print(span.string)
'

간단한 작업에는 약간 과잉일 수 있지만 예를 들어 다음과 같은 다른 HTML이 있는 경우 더 어려운 작업에서는 더 잘 작동하고 더 쉬울 것입니다.

<span>
 aghahan.com
</span>
<span>
 pouyamannequin.com
</span>

Question 4

awk -F ">" '{print $2}' filename| sed "s/<.*//g"

산출

aghahan.com
pouyamannequin.com

Answer

awk -F ">" '{print $2}' filename| sed "s/<.*//g"

산출

aghahan.com
pouyamannequin.com

sed AWK를 사용하여 시작 패턴과 끝 패턴 사이의 문자열을 추출하는 방법은 무엇입니까?

답변1

답변2

답변3

답변4

관련 정보