Unix에서 CSV 조작 - 최고의 기본 Unix 학습 도구

Unix에서 CSV 조작 - 최고의 기본 Unix 학습 도구

저는 Unix 환경이 처음입니다. Unix에서 CSV 파일을 조작하는 방법(예: 새 열 추가, 인덱스별로 CSV에서 값 가져오기, 새 CSV 파일에 값 추가 등)을 배우고 싶습니다. Python을 사용할 수 있다는 것을 알고 있지만 시스템에서는 Pandas, Numpy 등을 사용할 수 없도록 제한합니다. 저는 CSV 파일을 구문 분석하고 조작하는 기본 Unix 도구를 배우고 싶습니다. 나는 awk, sed가 간단한 CSV 파일에는 괜찮지만 복잡한 CSV 파일에는 지저분해질 수 있다는 것을 읽었습니다(하지만 여러분의 의견을 듣고 싶습니다). 어떤 종류의 설치도 필요하지 않은 CSV 조작을 위한 기본 Unix 도구에 대한 전문가의 조언을 찾고 있습니다. 어떤 도구에 집중해야 합니까? 미리 감사드립니다.

답변1

나에게 있어 최고의 CSV Unix 도구는 Miller입니다.

https://miller.readthedocs.io/en/latest/

답변2

저는 CSV용 "표준 Unix 도구"를 모릅니다.,자르다,grep,sed잠깐...뭐든요.

  • 이전에 GoCSV에 대해 언급한 적이 있으며 여전히 가장 높은 권장 사항입니다. 속도가 빠르고 주로 스트리밍용입니다(파이프용으로 설계됨). csvkit에서 영감을 받았습니다.
  • csvkit은 좋지만 ARM 기반 시스템(M1 프로세서가 탑재된 Macbook Air)에 설치하는 데 문제가 있습니다. csvkit이 이에 의존하기 때문에 numpy가 문제인 경우 csvkit이 부적격할 수 있습니다. 체크아웃한다면이 문서, csvkit에 영감을 준 다른 도구를 볼 수 있습니다. 이들 중 일부는 시스템에서 더 표준적일 수 있습니다.

당신은 Python으로 스크립트를 작성한다고 직접 언급했지만 numpy나 pandas가 필요하다고 생각하는 것 같습니다. 넌 몰라. 작업을 간단하게 만들고 코드가 매우 짧지만 Python 자체 언어를 사용하여 CSV를 읽고, 정렬하고, 색인화하고, 필터링하고, 작성하는 데 필요한 모든 작업을 수행할 수 있습니다.데이터 세트기준 치수. 공식 문서는 좋은 참고 자료이지만 초보자에게는 초보자용 Python을 추천합니다.CSV 파일. 나는 또한 Python으로 나만의 CSV 입문 책을 썼습니다.Python이 포함된 CSV에 오신 것을 환영합니다!, StackOverflow에서 어려움을 겪고 있는 사람들로부터 많은 Python-CSV 코드를 읽은 것을 기반으로 합니다.

관련 정보