Unix 플랫 파일(awk, sed)에서 선택한 큰따옴표 필드에서 선행 0을 제거합니다.

Question 1

사용 awk:

awk -F, '{OFS=","; sub(/"0+/, "\"", $3); sub(/"0+/, "\"", $5)}1'

헤더에 실제로 앞에 0이 없는 한 문제가 되지 않지만 필요한 경우 다음을 수행할 수 있습니다.

awk -F, 'NR > 1{OFS=","; sub(/^"0+/, "\"", $3); sub(/^"0+/, "\"", $5)}1'

이렇게 하면 "필드 3과 5의 모든 선행 0이 따옴표로만 대체됩니다.

Answer

사용 awk:

awk -F, '{OFS=","; sub(/"0+/, "\"", $3); sub(/"0+/, "\"", $5)}1'

헤더에 실제로 앞에 0이 없는 한 문제가 되지 않지만 필요한 경우 다음을 수행할 수 있습니다.

awk -F, 'NR > 1{OFS=","; sub(/^"0+/, "\"", $3); sub(/^"0+/, "\"", $5)}1'

이렇게 하면 "필드 3과 5의 모든 선행 0이 따옴표로만 대체됩니다.

Question 2

사용밀러, 헤더가 포함된 CSV 파일 제공

$ cat file.csv
"000001","000002","000003","000004","000005","000006","000007"
"ACCOUNT","REAL","022000046977525","REAL","00000220000488","ONLINE",......

(헤더의 앞에 오는 0이 영향을 받지 않는다는 것을 증명하기 위해 어리석은 필드 이름을 선택했습니다.) 그런 다음

$ mlr --csv --ofmt '%.0f' --quote-all put '$000003=$000003; $000005=$000005' file.csv
"000001","000002","000003","000004","000005","000006","000007"
"ACCOUNT","REAL","22000046977525","REAL","220000488","ONLINE","......"

또는 csvformat(python csvkit에서) 및 numfmt(GNU Coreutils에서) 다음을 사용하세요.

$ csvformat file.csv | numfmt -d, --header --field 3,5 --format '%.0f' | csvformat -U2
"000001","000002","000003","000004","000005","000006","000007"
"ACCOUNT","REAL","22000046977525","REAL","220000488","ONLINE","......"

Answer

사용밀러, 헤더가 포함된 CSV 파일 제공

$ cat file.csv
"000001","000002","000003","000004","000005","000006","000007"
"ACCOUNT","REAL","022000046977525","REAL","00000220000488","ONLINE",......

(헤더의 앞에 오는 0이 영향을 받지 않는다는 것을 증명하기 위해 어리석은 필드 이름을 선택했습니다.) 그런 다음

$ mlr --csv --ofmt '%.0f' --quote-all put '$000003=$000003; $000005=$000005' file.csv
"000001","000002","000003","000004","000005","000006","000007"
"ACCOUNT","REAL","22000046977525","REAL","220000488","ONLINE","......"

또는 csvformat(python csvkit에서) 및 numfmt(GNU Coreutils에서) 다음을 사용하세요.

$ csvformat file.csv | numfmt -d, --header --field 3,5 --format '%.0f' | csvformat -U2
"000001","000002","000003","000004","000005","000006","000007"
"ACCOUNT","REAL","22000046977525","REAL","220000488","ONLINE","......"

Question 3

GNU sed 사용:

$ sed -re '
   s/","/\n/4;s//\n/2
   s/\n0*([0-9])/","\1/g
' file.csv

모든 필드가 참조된다고 가정합니다.

세 번째와 다섯 번째 필드를 줄 바꿈으로 표시하고 선행 0을 모두 제거합니다. 모두 0이면 필드가 사라지는 대신 끝에 그대로 유지됩니다.

Answer

GNU sed 사용:

$ sed -re '
   s/","/\n/4;s//\n/2
   s/\n0*([0-9])/","\1/g
' file.csv

모든 필드가 참조된다고 가정합니다.

세 번째와 다섯 번째 필드를 줄 바꿈으로 표시하고 선행 0을 모두 제거합니다. 모두 0이면 필드가 사라지는 대신 끝에 그대로 유지됩니다.

Unix 플랫 파일(awk, sed)에서 선택한 큰따옴표 필드에서 선행 0을 제거합니다.

답변1

답변2

답변3

관련 정보