![텍스트를 제거하는 데 어떤 파이프라인이 사용됩니까?](https://linux55.com/image/203495/%ED%85%8D%EC%8A%A4%ED%8A%B8%EB%A5%BC%20%EC%A0%9C%EA%B1%B0%ED%95%98%EB%8A%94%20%EB%8D%B0%20%EC%96%B4%EB%96%A4%20%ED%8C%8C%EC%9D%B4%ED%94%84%EB%9D%BC%EC%9D%B8%EC%9D%B4%20%EC%82%AC%EC%9A%A9%EB%90%A9%EB%8B%88%EA%B9%8C%3F.png)
다음과 같은 방법으로 데이터를 파일에 다운로드합니다(코드는 Valentin Bajrami에게 제공됨).
curl https://en.wikipedia.org/wiki/Help:Special_page -s | grep -o 'Special:[a-zA-Z0-9]*' | sort -u > special_page_names
단지 정확한 일치를 위해 사용하고 있지만 실제로는 Special:
데이터를 다운로드한 후에 는 이 Special:
텍스트가 없어야 합니다.
그 후에 sort
파이프라인을 통해 무엇을 삭제할 수 있습니까 Special:
?
답변1
다른 파이프가 필요하지 않습니다. 이 시도:
curl https://en.wikipedia.org/wiki/Help:Special_page -s | grep -oP 'Special:\K[a-zA-Z0-9]*' | sort -u > special_page_names