입력 파일:is2.txt
10.39.5.41,A1,B1
10.39.5.41,A2,B2
10.39.5.41,A3,B3
10.39.5.41,A4,B4
10.39.5.41,A5,B5
10.39.5.41,A6,B6
스크립트:
#!/bin/bash
second_column="OOOOOOO" # OOOOOOO will be added to every second column
third_column="XXXXXXXX" # XXXXXXXX will be added to every third column
awk -v second="$second_column" -v third="$third_column" 'BEGIN { FS="," }
{
if(a[$1])
{a[$1]=a[$1]";second"$2";third"$3}
else
{a[$1]=a[$1]second$2";"third$3}}
END{for (i in a)print i";"a[i];}' < is2.txt
output:
[root@testgfs2 test]# ./testawk.awk
10.39.5.41;OOOOOOOA1;XXXXXXXXB1;secondA2;thirdB2;secondA3;thirdB3;secondA4;thirdB4;secondA5;thirdB5;secondA6;thirdB6
쉘 변수(second_column, third_column)가 전체 출력에는 반영되지 않고 첫 번째 줄에만 반영되는 이유는 무엇입니까? 뭐가 문제 야?
예상 출력:
10.39.5.41;OOOOOOOA1;XXXXXXXXB1;OOOOOOOA2;XXXXXXXXB2;OOOOOOOA3;XXXXXXXXB3;OOOOOOOA4;XXXXXXXXB4;OOOOOOOA5;XXXXXXXXB5;OOOOOOOA6;XXXXXXXXB6
또한 이를 n개 열(예: n = 100)로 일반화할 수 있는 방법이 있습니까?
답변1
다음은 권장 간격과 들여쓰기가 포함된 awk 코드입니다. 문제를 볼 수 있습니까?
BEGIN { FS = "," }
{
if(a[$1])
a[$1] = a[$1] ";second" $2 ";third" $3
else
a[$1] = a[$1]second $2 ";" third$3
}
END {
for (i in a)
print i ";" a[i]
}
당신은 second
조항에 인용했습니다.third
if
예상 출력을 추측하면 다음과 같이 할 수 있습니다.
awk -v c2='OOOOOOO' -v c3='XXXXXXXX' -v FS=, -v OFS=';' -v ORS=';' '
!f {
printf "%s", $1
f=1
}
{
$1 = ""
$2 = c2 $2
$3 = c3 $3
}
1
' | sed 's/;;/;/g; s/;$//'
산출:
10.39.5.41;OOOOOOOA1;XXXXXXXXB1;OOOOOOOA2;XXXXXXXXB2;OOOOOOOA3;XXXXXXXXB3;OOOOOOOA4;XXXXXXXXB4;OOOOOOOA5;XXXXXXXXB5;OOOOOOOA6;XXXXXXXXB6
이 접근 방식을 일반화하려면 문자열 앞에 추가하려는 비트를 전달하고 이를 awk 배열로 분할할 수 있습니다. 그런 다음 명시적인 열 변수 대신 for 루프를 사용합니다.
awk -v prepends='OOOOOOO XXXXXXXX' -v FS=, -v OFS=';' -v ORS=';' '
BEGIN { split(prepends, cn, / +/) }
!f {
printf "%s", $1
f=1
}
{
$1 = ""
for(i=1; i<=NF; i++)
$i = cn[i-1] $i
}
1' | sed 's/;;/;/g; s/;$//'