Nasdaq 웹사이트에서 일부 입력 파일을 다운로드했습니다(예:ftp://emi.nasdaq.com/ITCH/01302018.NASDAQ_ITCH50.gz) 압축을 푼 후(Mac에서는 두 번 클릭) head, tail 또는 cat을 사용하여 파일 내용을 볼 수 없습니다. 왜곡된 문자만 보입니다. 각 파일을 세 번 정도 다운로드해 보았습니다. 터미널에 변경해야 할 설정이 있습니까? (이 컴퓨터에서 이 작업을 처음 수행합니다.)
또한 웹사이트에 제공된 내용과 비교하여 MD5를 확인해 보았습니다. 일치하지 않는 것 같습니다. 이 상황에서 무엇을 할 수 있습니까? 다시 말하지만, 비트 누락 가능성 등을 설명하기 위해 여러 번 다운로드했습니다.
이런 인기 있는 웹사이트에서는 손상된 데이터 파일을 업로드할 것 같지 않죠?
파일 내용을 보는 방법을 안내해 주시겠어요? 이전에는 이런 문제가 발생하지 않았습니다. 항상 head
or 를 실행하여 파일을 검사 할 수 있었습니다 cat
.
이러한 파일은 다음 폴더에 있습니다.ftp://emi.nasdaq.com/ITCH/
답변1
파일에 설명된 대로 NASDAQ TotalView-ITCH 데이터 소스가 포함되어 있습니다.데이터 뉴스 #2008 – 91.
파일에 사용되는 형식은 일반 텍스트가 아니라 바이너리 인코딩입니다.
이 바이너리 형식은 PDF 문서에 자세히 설명되어 있습니다.나스닥 TotalView-ITCH 4.0. 문서나스닥 TotalView-ITCH 3.1텍스트 기반 인코딩 형식에 대해 설명합니다.
이는 이러한 파일에 대해 더 자세히 알아볼 수 있는 방법일 뿐입니다. 이러한 도메인별 데이터 파일을 읽을 수 있는 소프트웨어가 있을 수 있습니다. 데이터 제공자(Nasdaq)는 해당 문서에서 이를 참조할 수 있습니다.
MD5 체크섬은 원본 압축 파일과 비교하여 확인해야 합니다. 압축되지 않은 파일(또는 재압축된 파일)이 아닙니다.
일반적으로 데이터 공급자가 데이터 파일에 대한 MD5 체크섬을 제공하면 이는 제공한 형식의 파일 체크섬이 됩니다.