대용량 파일에서 값이 없는 CSV 필드 제거

Question

이것이 당신에게 얼마나 도움이 되는지 확인해 보세요:

$ cut --complement -d, -f$(awk -F, '
NR > 1  {for (i=1; i<=NF; i++)  CNT[i, $i]++
        }
END     {for (c in CNT) if (CNT[c] == (NR-1))   {split (c, T, SUBSEP)
                                                 printf "%s%d", DL, T[1]
                                                 DL = ","
                                                }
        }
' /tmp/small_data.csv)  /tmp/small_data.csv

귀하의 cut버전에 해당 옵션이 있다고 가정합니다 --complement. 그렇지 않으면 인쇄 논리를 반대로 합니다. 해당 섹션에서 실패하면 awk행별 처리를 유지하세요.NREND

모든 행(제목 제외)의 모든 필드를 살펴보고 고유한 콘텐츠를 계산합니다. 해당 END섹션 에서 CNT행 수에서 헤더를 뺀 것과 같은 경우(즉, 필드의 모든 행에서 동일한 내용이 있는 경우) 인덱스를 분할하고 필드 번호를 인쇄합니다.

Answer 1

이것이 당신에게 얼마나 도움이 되는지 확인해 보세요:

$ cut --complement -d, -f$(awk -F, '
NR > 1  {for (i=1; i<=NF; i++)  CNT[i, $i]++
        }
END     {for (c in CNT) if (CNT[c] == (NR-1))   {split (c, T, SUBSEP)
                                                 printf "%s%d", DL, T[1]
                                                 DL = ","
                                                }
        }
' /tmp/small_data.csv)  /tmp/small_data.csv

귀하의 cut버전에 해당 옵션이 있다고 가정합니다 --complement. 그렇지 않으면 인쇄 논리를 반대로 합니다. 해당 섹션에서 실패하면 awk행별 처리를 유지하세요.NREND

모든 행(제목 제외)의 모든 필드를 살펴보고 고유한 콘텐츠를 계산합니다. 해당 END섹션 에서 CNT행 수에서 헤더를 뺀 것과 같은 경우(즉, 필드의 모든 행에서 동일한 내용이 있는 경우) 인덱스를 분할하고 필드 번호를 인쇄합니다.

대용량 파일에서 값이 없는 CSV 필드 제거

답변1

관련 정보