
curl
페이지를 다른 이름으로 저장하는 옵션이 있나요?텍스트?
즉, 브라우저에 페이지를 저장하는 것과 같습니다.텍스트 파일. 최소한 Firefox에는 이 옵션이 있습니다.
스크립트로 필요합니다. 다음과 같은 작업을 수행합니다.
curl -s http://...
그러나 모든 HTML 코드 없이도 작업을 더 쉽게 처리할 수 있습니다.
lynx
내가 원하는 것을 달성하는 옵션을 찾았 lynx -dump
지만 을 사용하고 싶습니다 curl
.
감사해요.
답변1
당신은 고려할 수 있습니다판독는 태그가 지정된 형식에서 다른 형식으로 파일을 변환하는 강력한 도구입니다.
curl -s URL | pandoc -f html -t plain
사용 방법은 간단합니다:
pandoc [OPTIONS] [FILES]
-f FORMAT, -r FORMAT --from=FORMAT, --read=FORMAT
-t FORMAT, -w FORMAT --to=FORMAT, --write=FORMAT
-o FILE --output=FILE
--data-dir=DIRECTORY
이동할 수 있는 형식을 입력 pandoc --list-input-format
하고 알아보세요.pandoc --list-output-formats
답변2
lynx
아니요. 다음 방법을 사용할 수 있습니다 .
lynx -dump URL
고쳐 쓰다. 행동. 죄송합니다. 나는 당신이 Bobcats를 이해하고 있다고 생각하지 않습니다.
이런 목적 으로 추천합니다 lynx
. 일반적으로 매우 읽기 쉬운 출력을 생성합니다. 때로는 -width
출력 너비를 늘리기 위해 옵션을 사용해야 하는 경우도 있습니다 .
답변3
여전히 curl
명령을 사용하여 에 파이프 할 수 있습니다 lynx
. 이는 인증이나 특정 컬 매개변수를 전달해야 하는 경우 유용합니다. 예를 들어:
curl --config auth.cfg $URL | lynx -stdin -dump -width=100
그러면 auth.cfg 파일 매개변수를 전달하여 URL에 액세스하고 html 페이지를 일반 텍스트(html 태그 및 이스케이프 문자 없이)로 인쇄합니다.
답변4
curl
명령이다파일 검색서버가 보낸 것과 정확히 동일한 형식으로 웹 서버에서 옵니다. 당신이 기대했던 것HTML 파일을 일반 텍스트로 변환, 이는 완전히 다른 작업입니다. 따라서 이 작업을 수행하려면 다른 도구가 필요합니다. 왜냐하면 curl
원래 그런 도구가 아니기 때문입니다.