모든 열을 포함하는 datafile.csv가 있습니다.
col1^col2^col3^col4^col5..^up-to col'n'
extractfile.csv에서 columnName^Value를 포함하는 데이터의 각 행을 읽는 방법
견본:
Row1:
col2^NY
col1^2017
col3^17:50
col5^Robert
Row2:
col2^NJ
col1^2015
col4^BMW|i8
col5^Cable,Mathew
datafile.csv의 해당 열 아래에 값을 배치합니다. 여기서 (extractfile.csv[$columname]=datafile.csv[$columname])
예상 출력:
col1^col2^col3^col4^col5..^col'n'
2017^NY^17:50^null^Robert^..^null^
2015^NJ^null^BMW|i8^Cable,Mathew^..^null^
노트:열에 대한 데이터가 없으면 출력.csv에서 해당 필드를 null로 설정해야 합니다. 구분 기호는 ^입니다.
미리 감사드립니다.
답변1
awk -F"^" '
NR==1{
col=split($0,H)
print
next
}
/:$/{
C[++i] = $0
}
NF > 1{
D[C[i],$1] = $2
}
END{
for(c in C)
for(h in H)
val = "null"
if(D[C[c],H[h]])
val = D[C[c],H[h]]
if(h < col)
printf "%s" FS, val
else
print val
}
' datafile.csv extractfile.csv
생산
col1^col2^col3^col4^col5^col'n'
2017^NY^17:50^null^Robert^null
2015^NJ^null^BMW|i8^Cable,Mathew^null
답변2
약간 다른 접근 방식. 불러라 awk -v RS="" -v n=6 -f myprog datafile.csv
:
BEGIN {
for (i = 1; i <= n; i++) {
result = result "^col" i;
}
print substr(result, 2);
}
{
delete data;
for (i = 2; i <= NF; i++) {
split($i, d, "^");
data[d[1]] = d[2];
}
result = "";
for (i = 1; i <= n; i++) {
value = data["col"i];
if (value) {
result = result "^" value;
} else {
result = result "^null";
}
}
print substr(result, 2);
}