특정 열만 비교하여 두 개의 CSV를 병합합니다.

Question

awk를 사용하는 것은 매우 쉽습니다:

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

old.csv 파일의 두 번째 필드를 "old"라는 배열에 저장한 다음 new.csv 파일의 경우 두 번째 필드가 "old" 배열에 없는 레코드를 인쇄합니다.

실제로 이는 따옴표 안의 파이프 문자를 존중하지 않습니다. 이를 위해 나는 Ruby의 csv 모듈을 좋아합니다.

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

Answer 1

awk를 사용하는 것은 매우 쉽습니다:

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

old.csv 파일의 두 번째 필드를 "old"라는 배열에 저장한 다음 new.csv 파일의 경우 두 번째 필드가 "old" 배열에 없는 레코드를 인쇄합니다.

실제로 이는 따옴표 안의 파이프 문자를 존중하지 않습니다. 이를 위해 나는 Ruby의 csv 모듈을 좋아합니다.

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

특정 열만 비교하여 두 개의 CSV를 병합합니다.

답변1

관련 정보