데이터 파일의 내용을 터미널에서 볼 수 없습니다

데이터 파일의 내용을 터미널에서 볼 수 없습니다

Nasdaq 웹사이트에서 일부 입력 파일을 다운로드했습니다(예:ftp://emi.nasdaq.com/ITCH/01302018.NASDAQ_ITCH50.gz) 압축을 푼 후(Mac에서는 두 번 클릭) head, tail 또는 cat을 사용하여 파일 내용을 볼 수 없습니다. 왜곡된 문자만 보입니다. 각 파일을 세 번 정도 다운로드해 보았습니다. 터미널에 변경해야 할 설정이 있습니까? (이 컴퓨터에서 이 작업을 처음 수행합니다.)

또한 웹사이트에 제공된 내용과 비교하여 MD5를 확인해 보았습니다. 일치하지 않는 것 같습니다. 이 상황에서 무엇을 할 수 있습니까? 다시 말하지만, 비트 누락 가능성 등을 설명하기 위해 여러 번 다운로드했습니다.

이런 인기 있는 웹사이트에서는 손상된 데이터 파일을 업로드할 것 같지 않죠?

파일 내용을 보는 방법을 안내해 주시겠어요? 이전에는 이런 문제가 발생하지 않았습니다. 항상 heador 를 실행하여 파일을 검사 할 수 있었습니다 cat.

이러한 파일은 다음 폴더에 있습니다.ftp://emi.nasdaq.com/ITCH/

답변1

파일에 설명된 대로 NASDAQ TotalView-ITCH 데이터 소스가 포함되어 있습니다.데이터 뉴스 #2008 – 91.

파일에 사용되는 형식은 일반 텍스트가 아니라 바이너리 인코딩입니다.

이 바이너리 형식은 PDF 문서에 자세히 설명되어 있습니다.나스닥 TotalView-ITCH 4.0. 문서나스닥 TotalView-ITCH 3.1텍스트 기반 인코딩 형식에 대해 설명합니다.

이는 이러한 파일에 대해 더 자세히 알아볼 수 있는 방법일 뿐입니다. 이러한 도메인별 데이터 파일을 읽을 수 있는 소프트웨어가 있을 수 있습니다. 데이터 제공자(Nasdaq)는 해당 문서에서 이를 참조할 수 있습니다.


MD5 체크섬은 원본 압축 파일과 비교하여 확인해야 합니다. 압축되지 않은 파일(또는 재압축된 파일)이 아닙니다.

일반적으로 데이터 공급자가 데이터 파일에 대한 MD5 체크섬을 제공하면 이는 제공한 형식의 파일 체크섬이 됩니다.

관련 정보