크롤링 문제 발생

Question

다음은 FAQ( wgetWikipedia용)입니다.

4.4. Wget이 robots.txt 파일의 /no-follow 속성을 무시하도록 만드는 방법은 무엇입니까?

기본적으로 Wget은 잘 실행되는 웹 스파이더 역할을 하며 사이트의 robots.txt파일과 규칙을 존중합니다.no-follow속성.

걱정하지 않음

2005년 1월 18일 Google 블로그 게시물 "댓글 스팸 방지"에는 Google이 이를 존중할 것이라고 명시되어 있습니다.rel="nofollow"하이퍼링크의 속성. 페이지 순위 알고리즘은 이제 대상 페이지 순위를 매길 때 이 속성이 있는 링크를 무시합니다. 의도된 결과는 웹마스터가 사용자 게시 링크를 수정하여 이 속성이 존재하도록 할 수 있으므로 Google이 해당 사이트에 링크를 게시하여 폭탄을 터뜨리려고 해도 해당 링크가 증가하지 않도록 하는 것입니다.

요점은 Wikipedia가 이러한 행위를 방지하기 위해 사이트를 설정했다는 것입니다.

Answer 1

다음은 FAQ( wgetWikipedia용)입니다.

4.4. Wget이 robots.txt 파일의 /no-follow 속성을 무시하도록 만드는 방법은 무엇입니까?

기본적으로 Wget은 잘 실행되는 웹 스파이더 역할을 하며 사이트의 robots.txt파일과 규칙을 존중합니다.no-follow속성.

걱정하지 않음

2005년 1월 18일 Google 블로그 게시물 "댓글 스팸 방지"에는 Google이 이를 존중할 것이라고 명시되어 있습니다.rel="nofollow"하이퍼링크의 속성. 페이지 순위 알고리즘은 이제 대상 페이지 순위를 매길 때 이 속성이 있는 링크를 무시합니다. 의도된 결과는 웹마스터가 사용자 게시 링크를 수정하여 이 속성이 존재하도록 할 수 있으므로 Google이 해당 사이트에 링크를 게시하여 폭탄을 터뜨리려고 해도 해당 링크가 증가하지 않도록 하는 것입니다.

요점은 Wikipedia가 이러한 행위를 방지하기 위해 사이트를 설정했다는 것입니다.

크롤링 문제 발생

답변1

관련 정보