Unix 환경의 CSV 파일에서 세미콜론을 쉼표로 바꿀 때 유일한 구분 기호는 무엇입니까?

Unix 환경의 CSV 파일에서 세미콜론을 쉼표로 바꿀 때 유일한 구분 기호는 무엇입니까?

Azure Machine Learning에서는 CSV 파일의 구분 기호로 세미콜론 대신 쉼표를 사용하도록 요구합니다. 이로 인해 세미콜론을 사용하고 셀 값에 쉼표가 많이 있는 *ix 컴퓨터에서는 많은 문제가 발생합니다.

문자를 이스케이프하거나 셀의 모든 쉼표를 바꾸는 올바른 방법은 무엇입니까? 이 형식 문제와 가능한 변환을 방지하거나 도움을 줄 수 있는 Unix 도구가 있습니까?

답변1

필드에 쉼표가 있는 경우 결과 CSV 파일은 필드를 해당 쉼표와 구분하는 방법을 생성해야 합니다. 예를 들어, 이는 일반적으로 다음 필드 주위에 따옴표를 배치하여 수행됩니다.

"field,1","field,2"

그렇지 않으면 필드와 필드의 일부 사이의 차이를 구분할 수 있는 방법이 없습니다. 어떤 역할을 선택하든 이 문제는 존재합니다.

필요한 경우 위의 예와 같이 이러한 항목을 검색하여 자신의 역할로 바꿀 수 있습니다.

sed -e 's/","/"~"/g' csvfile

관련 정보