브라우저가 아닌 클라이언트에서는 사이트에 접속할 수 없지만 웹 브라우저를 사용하여 접속할 수 있습니다.

Question 1

다른 사람들이 지적했듯이 웹사이트의 robots.txt에 이 내용이 있는지 확인하세요.

User-Agent: curl
Disallow: /

거기에 있으면 해당 특정 웹 사이트에서 컬을 사용할 수 없습니다

그렇다면 이 일은 할 수 없다.어느기다

User-agent: *
Disallow: /

찾으려면 URL 뒤에 /robots.txt를 입력하세요.example.com/robots.txt

Answer

다른 사람들이 지적했듯이 웹사이트의 robots.txt에 이 내용이 있는지 확인하세요.

User-Agent: curl
Disallow: /

거기에 있으면 해당 특정 웹 사이트에서 컬을 사용할 수 없습니다

그렇다면 이 일은 할 수 없다.어느기다

User-agent: *
Disallow: /

찾으려면 URL 뒤에 /robots.txt를 입력하세요.example.com/robots.txt

Question 2

다음 헤더를 추가하여 컬 요청이 작동하도록 했습니다. 이들 모두가 필요하며 User-Agent 헤더만으로는 충분하지 않습니다.

> User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:123.0) Gecko/20100101 Firefox/123.0
> Accept-Language: en-US,en;q=0.5
> Accept-Encoding: gzip, deflate, br
> Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8

브라우저 개발자 콘솔의 네트워크 탭에 있는 요청 헤더를 보면 이를 알 수 있습니다.

Accept 헤더는 간단히 Accept: */*.

Answer

다음 헤더를 추가하여 컬 요청이 작동하도록 했습니다. 이들 모두가 필요하며 User-Agent 헤더만으로는 충분하지 않습니다.

> User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:123.0) Gecko/20100101 Firefox/123.0
> Accept-Language: en-US,en;q=0.5
> Accept-Encoding: gzip, deflate, br
> Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8

브라우저 개발자 콘솔의 네트워크 탭에 있는 요청 헤더를 보면 이를 알 수 있습니다.

Accept 헤더는 간단히 Accept: */*.

Question 3

제가 팔로우하고 있는 사이트에도 같은 문제가 있습니다(그래서 내가 먼저 당신에게 질문을 한 거예요.). 이상한 점은 내가 이 사이트를 curl수년 동안 아무 문제 없이 팔로우(사용)해 왔다는 것입니다. 그러나 이제 이것이 "문제"가 되었습니다! 아마도 이것은경향?

어쨌든 - 귀하의 질문을 읽은 후 나에게 적합한 솔루션을 찾았습니다. lynx-"명령줄"브라우저. lynx옵션이 많기 때문에 독서 man lynx등에 시간을 투자하는 것이 좋습니다. 나에게 도움이 된 것은 다음과 같습니다.

lynx -dump -accept_all_cookies 'https://wherever.com/viewtopic.php?t=abc123' > my-dump.txt

Answer

제가 팔로우하고 있는 사이트에도 같은 문제가 있습니다(그래서 내가 먼저 당신에게 질문을 한 거예요.). 이상한 점은 내가 이 사이트를 curl수년 동안 아무 문제 없이 팔로우(사용)해 왔다는 것입니다. 그러나 이제 이것이 "문제"가 되었습니다! 아마도 이것은경향?

어쨌든 - 귀하의 질문을 읽은 후 나에게 적합한 솔루션을 찾았습니다. lynx-"명령줄"브라우저. lynx옵션이 많기 때문에 독서 man lynx등에 시간을 투자하는 것이 좋습니다. 나에게 도움이 된 것은 다음과 같습니다.

lynx -dump -accept_all_cookies 'https://wherever.com/viewtopic.php?t=abc123' > my-dump.txt

브라우저가 아닌 클라이언트에서는 사이트에 접속할 수 없지만 웹 브라우저를 사용하여 접속할 수 있습니다.

답변1

답변2

답변3

관련 정보