데이터 추출을 위한 정규식/패턴 일치 문제

Question 1

cdv 형식이 무엇인지는 확실하지 않지만 숫자와 선택적 측정 단위를 제거한 다음 나머지 쉼표 뒤의 공백을 압축하면 되는 것 같습니다.

sed 's/ *[0-9]\+\(,[0-9]\+\)\?\( *km *\)\?//g;s/, \+/,/g' file.txt

가독성을 높이려면 확장 정규식과 동일합니다(GNU의 경우 sed).

sed -r 's/ *[0-9]+(,[0-9]+)?( *km *)?//g;s/, +/,/g' file.txt

Answer

cdv 형식이 무엇인지는 확실하지 않지만 숫자와 선택적 측정 단위를 제거한 다음 나머지 쉼표 뒤의 공백을 압축하면 되는 것 같습니다.

sed 's/ *[0-9]\+\(,[0-9]\+\)\?\( *km *\)\?//g;s/, \+/,/g' file.txt

가독성을 높이려면 확장 정규식과 동일합니다(GNU의 경우 sed).

sed -r 's/ *[0-9]+(,[0-9]+)?( *km *)?//g;s/, +/,/g' file.txt

Question 2

나에게 비슷한 데이터세트가 있습니다.

sed -e 's/[0-9]*.[0-9]*.km//g' -e 's/\,\ /\,/g' <file>

Answer

나에게 비슷한 데이터세트가 있습니다.

sed -e 's/[0-9]*.[0-9]*.km//g' -e 's/\,\ /\,/g' <file>

Question 3

파티에 조금 늦었습니다... GNU awk + sed를 사용하여 수행하는 방법은 다음과 같습니다.

awk -F'[[:space:]]*[[:digit:],]+[[:space:]]*?km[[:space:],]*' 'BEGIN{OFS=","}{$1=$1;print}' | sed 's/,$//g'

Answer

파티에 조금 늦었습니다... GNU awk + sed를 사용하여 수행하는 방법은 다음과 같습니다.

awk -F'[[:space:]]*[[:digit:],]+[[:space:]]*?km[[:space:],]*' 'BEGIN{OFS=","}{$1=$1;print}' | sed 's/,$//g'

관련 정보