csvkit

CSV 파서를 사용하여 특정 열을 기반으로 CSV 행 중복 제거
csvkit

CSV 파서를 사용하여 특정 열을 기반으로 CSV 행 중복 제거

이 작업을 검색한 결과 다음과 같은 오래된 질문을 발견했습니다. 지정된 열을 기반으로 CSV에서 중복 항목 제거 특정 열을 기반으로 CSV에서 고유한 레코드 식별 awk하지만 내 데이터가 여러 개의 중첩된 큰따옴표가 있는 복잡한 CSV 파일이기 때문에 그렇게 할 수 없습니다 . 다음과 같은 중복을 제거하고 싶다고 가정해 보겠습니다(단순화된 상황). Ref,xxx,zzz ref1,"foo, bar, base",qux ref1,"foo, bar, base",bar ref2,aaa,bbb 출력에는 다...

Admin

CsvKit을 사용하여 CSV 열 자르기
csvkit

CsvKit을 사용하여 CSV 열 자르기

CSVKit을 사용하여 열 길이를 자르는 방법은 무엇입니까? 정의는 다음과 같습니다: 열 1: 길이 제한 없음 2열 : <2자 이내> 이스케이프된(인용) 열과 새 행을 올바르게 처리해야 합니다. 예를 들어: First Header,Second Header foo, foo,b foo,bar foo,"bar" foo,"""bar" foo," bar" 되어야 한다 First Header,Second Header foo, foo,b foo,ba foo,ba foo,"""b" foo," b" ...

Admin

bash에 csvkit을 설치하는 방법
csvkit

bash에 csvkit을 설치하는 방법

csvformatKusalananda는 다음에서 사용하는 것이 좋습니다 .csvkitjq @csv큰따옴표 없이 csv 형식으로 포맷" 답변 jq로 json을 구문 분석하는 방법. 이 답변에는 Python 사용이 포함되지 않은 것 같습니다. 하지만 csvkit설치 튜토리얼그리고 그것의설치 문제 해결Python을 사용하는 것이 필요하거나 의존하는 것 같습니다. 이것은 초보자로서 나를 혼란스럽게 만들었습니다. Python을 사용하지 않고 git bash에 csvkit을 설치할 수 있습니까(예: 스파이더 또...

Admin

Linux/Bash의 이 csv 파일에서 이 두 열을 어떻게 분리할 수 있습니까?
csvkit

Linux/Bash의 이 csv 파일에서 이 두 열을 어떻게 분리할 수 있습니까?

이 두 열을 각각 별도의 텍스트 파일로 분리하고 싶습니다. 이 데이터는 타이타닉 승객 데이터가 포함된 Kaggle의 csv 파일에서 가져온 것입니다. 첫 번째 열은 승객 수이고, 두 번째 열은 승객의 연령입니다. 즉, 1세 어린이 10명, 2세 어린이 12명 등입니다. 나는 그것들을 분리하여 명령줄의 간단한 차트에 넣고 싶습니다. 지금까지 나는 csvkit을 사용하여 데이터 세트를 조작했습니다. 감사해요! 저는 Linux를 처음 접했고 커뮤니티에 참여하는 것은 이번이 처음입니다! 10 1 12 2...

Admin

여러 파일의 헤더별로 열을 자르는 csvcut 스크립트를 작성하는 방법은 무엇입니까?
csvkit

여러 파일의 헤더별로 열을 자르는 csvcut 스크립트를 작성하는 방법은 무엇입니까?

이후 csvcut(부터csvkit) 한 번에 두 개 이상의 파일을 사용하지 않고 여러 파일을 처리하는 데 사용하려면 스크립트를 작성해야 합니다. 첫 번째 매개변수는 구분 기호, 두 번째 매개변수는 추출할 열의 헤더, 나머지 매개변수는 파일 이름입니다. 파일 이름이 누락된 경우 스크립트는 표준 입력에 있어야 합니다. 이렇게되어야합니다 csvcut ';' Measure calories.csv 나는 그것에 대해 별로 익숙하지 않습니다 csvkit. 누구든지 도와줄 수 있나요? ...

Admin

CSV 필드 최대 길이 오류 및 quoteing=csv.QUOTE_NONE 설정
csvkit

CSV 필드 최대 길이 오류 및 quoteing=csv.QUOTE_NONE 설정

csvcut쉼표로 구분된 .csv 파일에서 실행한 후: [root@server files]# csvcut -c title,mpn,overview,techspecs2,image_carousel_elargesrc syn_multi-image.csv > syn_scraped_cut.csv 오류가 발생합니다. CSV에 최대 길이인 131072자보다 긴 필드가 포함되어 있습니다. field_size_limit 매개변수를 사용하여 최대값을 늘리거나 quoteing=csv.QUOTE_NONE을 설정해 보...

Admin

csvsql 쿼리 구문 오류가 발생했습니까?
csvkit

csvsql 쿼리 구문 오류가 발생했습니까?

열 값이 "PI Date"인 레코드를 attributes.csv제외하고 모든 레코드를 새 파일로 검색하려는 csv 파일이 있습니다 .attributes_withoutPIDate.csvName csvsql이런 식으로 명령을 내리다 csvsql -d ',' -I --query 'select * where Name <> "PI Date" from attributes' attributes.csv > attributes_withoutPIDate.csv 오류 발생 (sqlite3.Ope...

Admin