File1.csv에서 두 파일의 열 이름이 동일한 File2.csv로 값을 추출하는 방법

File1.csv에서 두 파일의 열 이름이 동일한 File2.csv로 값을 추출하는 방법

모든 열을 포함하는 datafile.csv가 있습니다.

col1^col2^col3^col4^col5..^up-to col'n'

extractfile.csv에서 columnName^Value를 포함하는 데이터의 각 행을 읽는 방법

견본:

Row1:
col2^NY
col1^2017
col3^17:50
col5^Robert

Row2:
col2^NJ
col1^2015
col4^BMW|i8
col5^Cable,Mathew

datafile.csv의 해당 열 아래에 값을 배치합니다. 여기서 (extractfile.csv[$columname]=datafile.csv[$columname])

예상 출력:

col1^col2^col3^col4^col5..^col'n'
2017^NY^17:50^null^Robert^..^null^
2015^NJ^null^BMW|i8^Cable,Mathew^..^null^

노트:열에 대한 데이터가 없으면 출력.csv에서 해당 필드를 null로 설정해야 합니다. 구분 기호는 ^입니다.

미리 감사드립니다.

답변1

awk -F"^" '
    NR==1{
        col=split($0,H)
        print
        next
    }
    /:$/{
        C[++i] = $0
    }
    NF > 1{
        D[C[i],$1] = $2
    }
    END{
        for(c in C)
            for(h in H)
                val = "null"
                if(D[C[c],H[h]])
                    val = D[C[c],H[h]]          
                if(h < col)
                    printf "%s" FS, val
                else
                    print val
    }
    ' datafile.csv extractfile.csv

생산

col1^col2^col3^col4^col5^col'n'
2017^NY^17:50^null^Robert^null
2015^NJ^null^BMW|i8^Cable,Mathew^null

답변2

약간 다른 접근 방식. 불러라 awk -v RS="" -v n=6 -f myprog datafile.csv:

BEGIN {
    for (i = 1; i <= n; i++) {
        result = result "^col" i;
    }
    print substr(result, 2);
}
{
    delete data;
    for (i = 2; i <= NF; i++) {
        split($i, d, "^");
        data[d[1]] = d[2];
    }
    result = "";
    for (i = 1; i <= n; i++) {
        value = data["col"i];
        if (value) {
            result = result "^" value;
        } else {
            result = result "^null";
        }
    }
    print substr(result, 2);
}

관련 정보