파일 1이 있습니다.
col1=val1|col2=val2|col3=val3|col4=val4
col1=val1|col2=val2|col4=val4|col5=val5|col6=val6
col1=val1|col3=val3|col4=val4|col6=val6
col1=val1|col2=val2|col3=val3|col4=val4|col5=val5|col6=val6
그리고 file2의 고유 열 목록은 다음과 같습니다.
col1
col2
col3
col4
col5
col6
file2 열 시퀀스를 기반으로 파이프 구분 기호를 사용하여 별도의 파일에 있는 file1에서 해당 값을 가져와야 합니다.
출력은 다음과 같습니다.
val1|val2|val3|val4|||
val1|val2||val4|val5|val6
val1||val3|val4||val6
val1|val2|val3|val4|val5|val6
답변1
이름=값 쌍으로 데이터를 입력할 때마다 가장 좋은 방법은 먼저 이름->값 배열을 만든 다음 명명된 인덱스로 해당 배열의 내용을 인쇄하는 것입니다. 이 경우 이러한 이름의 순서는 다른 파일에서 나오므로 해당 파일을 먼저 읽으십시오.
$ cat tst.awk
BEGIN { FS="[=|]"; OFS="|" }
NR==FNR { outFldNames[++numOutFlds]=$0; next }
{
delete name2val
for (inFldNr=1; inFldNr<NF; inFldNr++) {
name2val[$inFldNr] = $(inFldNr+1)
}
for (outFldNr=1; outFldNr<=numOutFlds; outFldNr++) {
printf "%s%s", name2val[outFldNames[outFldNr]], (outFldNr<numOutFlds ? OFS : ORS)
}
}
$ awk -f tst.awk file2 file1
val1|val2|val3|val4||
val1|val2||val4|val5|val6
val1||val3|val4||val6
val1|val2|val3|val4|val5|val6
답변2
perl -wMstrict -Mvars='*A' -lne '
if ( @ARGV ) { push @A, $_; }
else {
my %h = /([^|=]+)=([^|]+)/g;
$,="|"; print map { $h{$_} // (($_ eq $A[-1]) ? q/|/ : q//) } @A;
}
' file2 file1
출력의 첫 번째 줄을 확인하세요. 여기에는 3개의 파이프가 있습니다. 그럼 map
논리는 이렇습니다.
산출
val1|val2|val3|val4|||
val1|val2||val4|val5|val6
val1||val3|val4||val6
val1|val2|val3|val4|val5|val6
답변3
$ cat file1
col1=val1|col2=val2|col3=val3|col4=val4
col1=val1|col2=val2|col4=val4|col5=val5|col6=val6
col1=val1|col3=val3|col4=val4|col6=val6
col1=val1|col2=val2|col3=val3|col4=val4|col5=val5|col6=val6
file2에 나열되지 않은 열이 생략되었음을 보여주기 위해 file2를 변경했습니다.
$ cat file2
col1
col2
col4
col5
col6
스크립트:
#!/bin/bash
patterns="$(tr '\n' '|' < file2| sed 's/|$//')"
awk -F'|' -v pat="$patterns" '{
o=0
for (i=1; i<=6; i++) {
f=i-o
split($f,a,"=")
if ( a[1] ~ i ) {
if ( a[1] ~ pat ) {
printf "%s", a[2]
}
if (i != 6) {printf "|"}
} else {
printf "|"
o++
}
}
printf "\n"
}' file1
col3 값 없이 출력:
$ ./script
val1|val2||val4|||
val1|val2||val4|val5|val6
val1|||val4||val6
val1|val2||val4|val5|val6
답변4
awk 및 수동 매핑을 사용하는 고전적인 프로그래밍 접근 방식은 다음과 같습니다.
$ awk -F"[=|]" 'NR==FNR{header[++c]=$1;next}\
{
record="";
for (h=1;h<=c;h++)
{
found="*";
for (field=1;field<=NF;field+=2) \
{
if ($field==header[h])
{found=$(field+1);break}
};
record=record "|" found;
}
print record
}' file2 file1
#Output:
|val1|val2|val3|val4|*|*
|val1|val2|*|val4|val5|val6
|val1|*|val3|val4|*|val6
|val1|val2|val3|val4|val5|val6
다른 file2의 경우 - 다음과 같은 다른 열 순서
col6
col4
col3
col5
col2
col1
그에 따라 출력은 다음과 같습니다.
|*|val4|val3|*|val2|val1
|val6|val4|*|val5|val2|val1
|val6|val4|val3|*|*|val1
|val6|val4|val3|val5|val2|val1