텍스트를 제거하는 데 어떤 파이프라인이 사용됩니까?

텍스트를 제거하는 데 어떤 파이프라인이 사용됩니까?

다음과 같은 방법으로 데이터를 파일에 다운로드합니다(코드는 Valentin Bajrami에게 제공됨).

curl https://en.wikipedia.org/wiki/Help:Special_page -s | grep -o 'Special:[a-zA-Z0-9]*' | sort -u > special_page_names

단지 정확한 일치를 위해 사용하고 있지만 실제로는 Special:데이터를 다운로드한 후에 는 이 Special:텍스트가 없어야 합니다.

그 후에 sort파이프라인을 통해 무엇을 삭제할 수 있습니까 Special:?

답변1

다른 파이프가 필요하지 않습니다. 이 시도:

curl https://en.wikipedia.org/wiki/Help:Special_page -s | grep -oP 'Special:\K[a-zA-Z0-9]*' | sort -u > special_page_names

관련 정보