터미널에서 파일 다운로드

터미널에서 파일 다운로드

터미널을 사용하여 .txt 파일을 다운로드하려고 합니다. 링크는 다음과 같습니다(링크를 연 후 즉시 다운로드가 시작됩니다).

https://es.osdn.net/projects/sfnet_kaldi/downloads/wsj0-train-spkrinfo.txt

명령을 사용하여 다운로드를 시도했습니다.

wget "https://es.osdn.net/projects/sfnet_kaldi/downloads/wsj0-train-spkrinfo.txt"

불행히도 명령을 실행한 후 얻는 유일한 결과는 페이지 소스입니다.

터미널에서 이 파일을 다운로드하는 올바른 방법이 무엇인지 말해 줄 수 있는 사람이 있습니까?

미리 감사드립니다!

답변1

HTML을 따르면 콘텐츠의 실제 소스를 숨기기 위해 몇 가지 트릭을 수행합니다.

다운로드하려는 파일은 다음을 사용하여 파일을 얻은 소스에서 다운로드할 수 있습니다.

 wget http://jaist.dl.sourceforge.net/project/kaldi/wsj0-train-spkrinfo.txt

따라서 유닉스 지식이 부족하다는 것이 아니라 결국에는 의도적으로 둔감해지는 것입니다.

또한 홈 페이지에서 이 프로젝트(kaldi)의 모든 파일에 액세스할 수 있습니다.https://sourceforge.net/projects/kaldi/files/(원래 링크로 가리키는 이전 버전)

거기에 가면 최신 버전이 있는 것을 볼 수 있습니다.https://github.com/kaldi-asr/kaldi

답변2

귀하의 링크는 텍스트 파일 링크처럼 "보이고" 귀하가 시도하는 방식으로 다운로드되어야 합니다 wget. 모든 작업을 올바르게 수행하셨습니다. 문제는 사이트를 운영하는 사람들이 "교활하게" 행동하고 있다는 것입니다. 그들은 링크가 실제 텍스트 파일이 아니도록 사이트를 구성했으며 사용자가 웹 인터페이스를 탐색하고 최소한 한 번 더 클릭하도록 강요하고 싶어합니다. 나는 이런 사이트를 싫어하지만 그 콘텐츠는 규칙입니다.

다른 사람이 해결 방법을 제안할 수도 있지만 해결 방법은 모든 사이트에서 작동하지 않으며 반드시 동일한 사이트의 다른 페이지에서도 작동하지 않습니다.

답변3

페이지 자체에 실제로 다음과 같이 나와 있습니다.

wget -O wsj0-train-spkrinfo.txt \
     'https://es.osdn.net/frs/g_redir.php?m=kent&f=kaldi%2Fwsj0-train-spkrinfo.txt'

그러나 불행히도 이에 대한 일반적인 규칙은 없으며 페이지 구현에 따라 다릅니다.

관련 정보