csv 파일의 필드 1,2에서 중복 행만 인쇄

Question 1

$ awk -F, 'NR==FNR{a[$1,$2]++; next} a[$1,$2]>1' file.txt file.txt 
spark2-thrift-sparkconf,spark.history.fs.logDirectory,{{spark_history_dir}}
spark2-thrift-sparkconf,spark.history.fs.logDirectory,true

동일한 입력 파일을 두 번 사용하여 두 파일을 처리합니다.

NR==FNR{a[$1,$2]++; next}처음 두 필드를 키로 사용하여 발생 횟수를 저장합니다.
a[$1,$2]>1두 번째 패스 동안 개수가 1보다 큰 경우에만 인쇄

반대의 경우에는 조건 확인을 변경하십시오.

$ awk -F, 'NR==FNR{a[$1,$2]++; next} a[$1,$2]==1' file.txt file.txt 
spark2-thrift-sparkconf,spark.history.Log.logDirectory,true
spark2-thrift-sparkconf,spark.history.DF.logDirectory,true

Answer

$ awk -F, 'NR==FNR{a[$1,$2]++; next} a[$1,$2]>1' file.txt file.txt 
spark2-thrift-sparkconf,spark.history.fs.logDirectory,{{spark_history_dir}}
spark2-thrift-sparkconf,spark.history.fs.logDirectory,true

동일한 입력 파일을 두 번 사용하여 두 파일을 처리합니다.

NR==FNR{a[$1,$2]++; next}처음 두 필드를 키로 사용하여 발생 횟수를 저장합니다.
a[$1,$2]>1두 번째 패스 동안 개수가 1보다 큰 경우에만 인쇄

반대의 경우에는 조건 확인을 변경하십시오.

$ awk -F, 'NR==FNR{a[$1,$2]++; next} a[$1,$2]==1' file.txt file.txt 
spark2-thrift-sparkconf,spark.history.Log.logDirectory,true
spark2-thrift-sparkconf,spark.history.DF.logDirectory,true

Question 2

cut처음 두 필드는 uniq제안한 대로 수행하고 grep원본 파일의 행에 대한 결과를 사용합니다.

cut -d, -f1,2 file.cvs |uniq -d|grep -Ff - file.cvs

파일이 아직 정렬되지 않은 경우 다음 전에 정렬해야 합니다 uniq.

cut -d, -f1,2 file.cvs |sort|uniq -d|grep -Ff - file.cvs

두 번째 질문(반대 결과)의 경우 -u대신 option을 사용하십시오 -d.

cut -d, -f1,2 file.cvs |sort|uniq -u|grep -Ff - file.cvs

Answer

cut처음 두 필드는 uniq제안한 대로 수행하고 grep원본 파일의 행에 대한 결과를 사용합니다.

cut -d, -f1,2 file.cvs |uniq -d|grep -Ff - file.cvs

파일이 아직 정렬되지 않은 경우 다음 전에 정렬해야 합니다 uniq.

cut -d, -f1,2 file.cvs |sort|uniq -d|grep -Ff - file.cvs

두 번째 질문(반대 결과)의 경우 -u대신 option을 사용하십시오 -d.

cut -d, -f1,2 file.cvs |sort|uniq -u|grep -Ff - file.cvs

Question 3

앗해결책:

--csv 파일의 필드 1,2에서 중복 행만 인쇄

awk -F, '$1==f1 && $2==f2{ printf "%s,%s,%s\n%s\n", f1,f2,f3,$0 }
        { f1=$1; f2=$2; f3=$3 }' <(sort -t, -k1,1 -k2,2 file.txt)

산출:

spark2-thrift-sparkconf,spark.history.fs.logDirectory,{{spark_history_dir}}
spark2-thrift-sparkconf,spark.history.fs.logDirectory,true

--csv 파일에서 중복 행 제외(필드 1,2)

awk -F, 'f1 && f2{ if($1!=f1 || $2!=f2) { printf "%s,%s,%s\n", f1,f2,f3 } else next }
        { f1=$1; f2=$2; f3=$3 }' <(sort -t, -k1,1 -k2,2 file.txt)

산출:

spark2-thrift-sparkconf,spark.history.DF.logDirectory,true
spark2-thrift-sparkconf,spark.history.fs.logDirectory,{{spark_history_dir}}

Answer

앗해결책:

--csv 파일의 필드 1,2에서 중복 행만 인쇄

awk -F, '$1==f1 && $2==f2{ printf "%s,%s,%s\n%s\n", f1,f2,f3,$0 }
        { f1=$1; f2=$2; f3=$3 }' <(sort -t, -k1,1 -k2,2 file.txt)

산출:

spark2-thrift-sparkconf,spark.history.fs.logDirectory,{{spark_history_dir}}
spark2-thrift-sparkconf,spark.history.fs.logDirectory,true

--csv 파일에서 중복 행 제외(필드 1,2)

awk -F, 'f1 && f2{ if($1!=f1 || $2!=f2) { printf "%s,%s,%s\n", f1,f2,f3 } else next }
        { f1=$1; f2=$2; f3=$3 }' <(sort -t, -k1,1 -k2,2 file.txt)

산출:

spark2-thrift-sparkconf,spark.history.DF.logDirectory,true
spark2-thrift-sparkconf,spark.history.fs.logDirectory,{{spark_history_dir}}

csv 파일의 필드 1,2에서 중복 행만 인쇄

답변1

답변2

답변3

관련 정보