연관 배열 BASH에서 중복 키 병합

Question 1

키와 값이 순전히 영숫자로 보장된다면 다음과 같이 작동할 수 있습니다.

declare -A output

make_list() {
  local IFS=" "
  declare -A keys                  # variables declared in a function are local by default
  for i in "${THE_LIST[@]}"
  do 
    i=${i//\'/}                    # since everything is alphanumeric, the quotes are useless
    declare -a keyvals=($i)        # split the entry, filename expansion isn't a problem
    key="${keyvals[0]}"            # get the first value as the key
    keys["$key"]=1                 # and save it in keys
    for val in "${keyvals[@]:1}"
    do                             # for each value
      declare -A "$key[$val]=1"    # use it as the index to an array. 
    done                           # Duplicates just get reset.
  done

  for key in "${!keys[@]}"
  do                               # for each key
    declare -n arr="$key"          # get the corresponding array
    output["$key"]="${!arr[*]}"    # and the keys from that array, deduplicated
  done
}

make_list
declare -p output  # print the output to check

샘플 입력을 사용하면 다음과 같은 출력을 얻습니다.

declare -A output=([item1]="data3 data2 data1" [item2]="data4" )

데이터 항목의 순서가 잘못되었지만 중복이 제거되었습니다.

아마도 csv모듈과 함께 Python을 사용하는 것이 가장 좋습니다.

Answer

키와 값이 순전히 영숫자로 보장된다면 다음과 같이 작동할 수 있습니다.

declare -A output

make_list() {
  local IFS=" "
  declare -A keys                  # variables declared in a function are local by default
  for i in "${THE_LIST[@]}"
  do 
    i=${i//\'/}                    # since everything is alphanumeric, the quotes are useless
    declare -a keyvals=($i)        # split the entry, filename expansion isn't a problem
    key="${keyvals[0]}"            # get the first value as the key
    keys["$key"]=1                 # and save it in keys
    for val in "${keyvals[@]:1}"
    do                             # for each value
      declare -A "$key[$val]=1"    # use it as the index to an array. 
    done                           # Duplicates just get reset.
  done

  for key in "${!keys[@]}"
  do                               # for each key
    declare -n arr="$key"          # get the corresponding array
    output["$key"]="${!arr[*]}"    # and the keys from that array, deduplicated
  done
}

make_list
declare -p output  # print the output to check

샘플 입력을 사용하면 다음과 같은 출력을 얻습니다.

declare -A output=([item1]="data3 data2 data1" [item2]="data4" )

데이터 항목의 순서가 잘못되었지만 중복이 제거되었습니다.

아마도 csv모듈과 함께 Python을 사용하는 것이 가장 좋습니다.

Question 2

이 솔루션은 값에 공백이 없으면 작동할 수 있습니다. 연관 배열을 사용하여 명령을 awk작성합니다 declare -A.

#!/bin/bash

THE_LIST=(
"'item1' 'data1 data2'"
"'item1' 'data2 data3'"
"'item2' 'data4'"
)

eval "$(\
  for i in "${THE_LIST[@]}"; do
    row=($(eval echo $i))
    echo "${row[@]}"
  done | awk '{ for (i=2; i<=NF; i++) if (seen[$1] !~ $i) { seen[$1]=seen[$1]$i" " } }
    END { for (s in seen) print "declare -A new_list["s"]=\""seen[s] }' | sed 's/[[:space:]]*$/"/'
)"

for i in "${!new_list[@]}"; do
  echo "$i: ${new_list[$i]}"
done

이것은 다음을 인쇄합니다:

item2: data4
item1: data1 data2 data3

값의 순서는 유지되지만 키의 순서가 변경됩니다. 배열 항목의 후행 공백을 자르는 방법을 몰라서 awk그냥 sed따옴표로 바꿨는데, 그건 이미 완전한 해킹입니다.

Answer

이 솔루션은 값에 공백이 없으면 작동할 수 있습니다. 연관 배열을 사용하여 명령을 awk작성합니다 declare -A.

#!/bin/bash

THE_LIST=(
"'item1' 'data1 data2'"
"'item1' 'data2 data3'"
"'item2' 'data4'"
)

eval "$(\
  for i in "${THE_LIST[@]}"; do
    row=($(eval echo $i))
    echo "${row[@]}"
  done | awk '{ for (i=2; i<=NF; i++) if (seen[$1] !~ $i) { seen[$1]=seen[$1]$i" " } }
    END { for (s in seen) print "declare -A new_list["s"]=\""seen[s] }' | sed 's/[[:space:]]*$/"/'
)"

for i in "${!new_list[@]}"; do
  echo "$i: ${new_list[$i]}"
done

이것은 다음을 인쇄합니다:

item2: data4
item1: data1 data2 data3

값의 순서는 유지되지만 키의 순서가 변경됩니다. 배열 항목의 후행 공백을 자르는 방법을 몰라서 awk그냥 sed따옴표로 바꿨는데, 그건 이미 완전한 해킹입니다.

연관 배열 BASH에서 중복 키 병합

답변1

답변2

관련 정보