스크립트를 통해 동적으로 변경되는 URL에서 다운로드

스크립트를 통해 동적으로 변경되는 URL에서 다운로드

이 페이지의 모든 Walter Lewin 강의를 wmv 형식으로 다운로드하는 스크립트를 작성하고 싶습니다.http://videolectures.net/mit801f99_physicals_classical_mechanics/

그러나 예를 들어 첫 번째 강의에서 wmv 파일에 대한 링크는 다음과 같습니다.http://videolectures.net/mit801f99_lewin_lec01/사람들이 페이지를 다시 로드하면 변경 사항이 발생합니다.

그러면 wmv 형식으로 강의를 하나씩 자동 다운로드하는 스크립트를 작성하는 것이 가능할까요? 이것이 어떻게 달성될 수 있습니까?

나는 노력했다 wget -A wmv -r http://videolectures.net/mit801f99_physics_classical_mechanics/

그리고

httrack "http://videolectures.net/mit801f99_physics_classical_mechanics/" -O ~/VideoLecture "-*" "+*.wmv"

둘 다 작동하지 않습니다.

참고: 이 질문은 물리 sx에 관한 다음 질문에서 비롯되었습니다.https://physical.stackexchange.com/questions/38033/walter-lewin-lectures-in-hd

답변1

for i in `seq -w 1 35`; do wget -p -U Mozilla -A wmv -r  "http://videolectures.net/mit801f99_lewin_lec$i/"; done

작동하는 것 같습니다. 하지만 내 생각에는 이 작업을 수행하려면 좀 더 우아한 방법이 있어야 합니다.

답변2

다운로드 페이지를 구문 분석해야 합니다. 브라우저에서 스크립트를 비활성화하고 웹페이지의 소스 코드를 엽니다.

이렇게 하면 다음과 같은 "흥미로운" 부분이 보입니다.

<p>
<img alt="Download Video" src="http://media.videolectures.net/rel.1350055487/icons/download.png" />
Download&nbsp;<a href='http://videolectures.net/site/secure_dl/eea58431dcc3454ad91ef7c89a49958b/50845240/afuvgg7fochnsdyl2ee4hlcsvwamqha2/tag=23313/mit801f99_lewin_lec01_01.wmv' rel='nofollow'>mit801f99_lewin_lec01_01.wmv</a>&nbsp;<small>(Video 336.5 MB)</small>
</p>

이제 이것은

  1. 홈페이지 다운로드
  2. 쿠키 기억하기
  3. 구문 분석 페이지 - 다운로드 찾기, lec01_*.wmv
  4. 찾은 URL과 기억된 쿠키를 사용하여 wmv 파일 다운로드

관련 정보