awk 변수로 교체

Question 1

이 작업은 sed를 사용하여 쉽게 수행할 수 있습니다.

$ sed -E -e 's/^((.*)_USD.*)/\2 \1/' input.txt 
P2_142 P2_142_USD16089440L_HJM27DSXX_L3
P2_144 P2_144_USD16089441L_HJM27DSXX_L3
P2_145 P2_145_USD16089442L_HJM27DSXX_L3
P2_168 P2_168_USD16089450L_HJM27DSXX_L3
P2_171 P2_171_USD16089451L_HJM27DSXX_L4
P2_172 P2_172_USD16089452L_HJM27DSXX_L4
P2_188 P2_188_USD16089456L_HJM27DSXX_L4
P2_262 P2_262_USD16089477L_HJJNWDSXX_L2
P2_270 P2_270_USD16089479L_HJJNWDSXX_L2
P2_271 P2_271_USD16089480L_HJJNWDSXX_L4

sed 스크립트는 두 개의 캡처 그룹, (즉 및로 둘러싸인 정규식 패턴을 사용합니다 ). 첫 번째는 전체 입력 라인이고, 두 번째는 이전 라인의 첫 번째 부분입니다 _USD. 각 입력 줄을 두 번째 캡처링 그룹( \2), 공백으로 바꾼 다음 첫 번째 캡처링 그룹( )으로 바꿉니다 \1.

또는 다음을 사용하여 awk:

awk -F'_' -e '{print $1 "_" $2 " " $0}' input.txt

입력 필드 구분 기호를 로 설정한 _다음 (각 입력 줄에 대해) 밑줄과 공백을 사용하여 처음 두 필드를 인쇄한 다음 전체 입력 줄을 인쇄합니다.

명령에 몇 가지 문제가 있습니다.

cat samples_long.10ids.txt | \
  awk -v sample="$1" '{gsub(/_USD.*/,"",sample); print $sample,$1}'

파일을 awk로 파이프하기 위해 cat이 필요하지 않습니다. awk는 명령줄에서 인수로 제공된 파일 이름을 읽을 수 있습니다.
awk 변수를 sample"$1"로 설정하고 있습니다. 일부 (표시되지 않음) 쉘 스크립트 래퍼의 첫 번째 매개 변수가 아니라 awk의 첫 번째 필드를 의미한다고 생각합니다. 그건 작동하지 않습니다. $1awk는 쉘에 존재하지 않습니다. awk가 입력 데이터 행을 읽을 때만 존재합니다.
필드 구분 기호로 무엇을 사용해야 하는지 awk에 알려주지 않았으므로 기본값은 공백(공백 및 탭)입니다. 예제 입력에는 공백 문자가 없으므로 $1 은 전체 입력 줄( $1 이라고 함 $0)입니다.
"$sample"을 인쇄 중입니다. 이는 변수에 포함된 필드 번호를 인쇄하고 싶다는 것을 awk에 알려줍니다 sample.

sample 문자열을 포함하므로 0해당 컨텍스트에서 print $sample-equivalent 로 평가됩니다 printing $0. 따라서 코드는 유효합니다 print $0 $1. 이것은 작동합니다 print $0 $0. 전체 줄을 두 번 인쇄합니다.
sample(계산된 결과의 필드 번호가 아닌 sample) 내용 자체를 인쇄하려면 print sample.
4번과 5번 항목에는 더 많은 설명이 필요하거나 최소한 더 이해하기 쉬운 예가 필요할 수 있습니다.

NFawk가 입력 라인을 읽을 때마다 라인의 필드 수 라는 변수를 자동으로 설정합니다 .

필드 수를 인쇄하려면 을 인쇄하면 됩니다 NF. 필드 번호가 NF와 같은 필드를 인쇄하려면 인쇄하십시오 $NF(이렇게 하면 입력 행의 마지막 필드가 인쇄됩니다).

NF(정수)에 대해 산술 및 기타 연산을 수행할 수도 있습니다. 예를 들어 print $(NF-1)마지막에서 두 번째 필드가 인쇄됩니다.

코드로 돌아가서, $sample정수 컨텍스트에는 sample값이 있으므로 전체 입력 줄인 을 0인쇄했습니다 .$0
위의 모든 사항을 고려하면 다음과 같이 작동합니다.
```
awk '{sample=$1; gsub(/_USD.*/,"",sample); print sample,$1}' samples_long.10ids.txt
```
하지만 이렇게 간단한 작업을 수행하기에는 너무 복잡합니다. awk는 입력을 밑줄로 구분된 필드로 분할할 수 있으므로 이를 수행하는 것이 더 쉽습니다.
```
awk -F'_' -e '{print $1 "_" $2 " " $0}' samples_long.10ids.txt
```

Answer

이 작업은 sed를 사용하여 쉽게 수행할 수 있습니다.

$ sed -E -e 's/^((.*)_USD.*)/\2 \1/' input.txt 
P2_142 P2_142_USD16089440L_HJM27DSXX_L3
P2_144 P2_144_USD16089441L_HJM27DSXX_L3
P2_145 P2_145_USD16089442L_HJM27DSXX_L3
P2_168 P2_168_USD16089450L_HJM27DSXX_L3
P2_171 P2_171_USD16089451L_HJM27DSXX_L4
P2_172 P2_172_USD16089452L_HJM27DSXX_L4
P2_188 P2_188_USD16089456L_HJM27DSXX_L4
P2_262 P2_262_USD16089477L_HJJNWDSXX_L2
P2_270 P2_270_USD16089479L_HJJNWDSXX_L2
P2_271 P2_271_USD16089480L_HJJNWDSXX_L4

sed 스크립트는 두 개의 캡처 그룹, (즉 및로 둘러싸인 정규식 패턴을 사용합니다 ). 첫 번째는 전체 입력 라인이고, 두 번째는 이전 라인의 첫 번째 부분입니다 _USD. 각 입력 줄을 두 번째 캡처링 그룹( \2), 공백으로 바꾼 다음 첫 번째 캡처링 그룹( )으로 바꿉니다 \1.

또는 다음을 사용하여 awk:

awk -F'_' -e '{print $1 "_" $2 " " $0}' input.txt

입력 필드 구분 기호를 로 설정한 _다음 (각 입력 줄에 대해) 밑줄과 공백을 사용하여 처음 두 필드를 인쇄한 다음 전체 입력 줄을 인쇄합니다.

명령에 몇 가지 문제가 있습니다.

cat samples_long.10ids.txt | \
  awk -v sample="$1" '{gsub(/_USD.*/,"",sample); print $sample,$1}'

파일을 awk로 파이프하기 위해 cat이 필요하지 않습니다. awk는 명령줄에서 인수로 제공된 파일 이름을 읽을 수 있습니다.
awk 변수를 sample"$1"로 설정하고 있습니다. 일부 (표시되지 않음) 쉘 스크립트 래퍼의 첫 번째 매개 변수가 아니라 awk의 첫 번째 필드를 의미한다고 생각합니다. 그건 작동하지 않습니다. $1awk는 쉘에 존재하지 않습니다. awk가 입력 데이터 행을 읽을 때만 존재합니다.
필드 구분 기호로 무엇을 사용해야 하는지 awk에 알려주지 않았으므로 기본값은 공백(공백 및 탭)입니다. 예제 입력에는 공백 문자가 없으므로 $1 은 전체 입력 줄( $1 이라고 함 $0)입니다.
"$sample"을 인쇄 중입니다. 이는 변수에 포함된 필드 번호를 인쇄하고 싶다는 것을 awk에 알려줍니다 sample.

sample 문자열을 포함하므로 0해당 컨텍스트에서 print $sample-equivalent 로 평가됩니다 printing $0. 따라서 코드는 유효합니다 print $0 $1. 이것은 작동합니다 print $0 $0. 전체 줄을 두 번 인쇄합니다.
sample(계산된 결과의 필드 번호가 아닌 sample) 내용 자체를 인쇄하려면 print sample.
4번과 5번 항목에는 더 많은 설명이 필요하거나 최소한 더 이해하기 쉬운 예가 필요할 수 있습니다.

NFawk가 입력 라인을 읽을 때마다 라인의 필드 수 라는 변수를 자동으로 설정합니다 .

필드 수를 인쇄하려면 을 인쇄하면 됩니다 NF. 필드 번호가 NF와 같은 필드를 인쇄하려면 인쇄하십시오 $NF(이렇게 하면 입력 행의 마지막 필드가 인쇄됩니다).

NF(정수)에 대해 산술 및 기타 연산을 수행할 수도 있습니다. 예를 들어 print $(NF-1)마지막에서 두 번째 필드가 인쇄됩니다.

코드로 돌아가서, $sample정수 컨텍스트에는 sample값이 있으므로 전체 입력 줄인 을 0인쇄했습니다 .$0
위의 모든 사항을 고려하면 다음과 같이 작동합니다.
```
awk '{sample=$1; gsub(/_USD.*/,"",sample); print sample,$1}' samples_long.10ids.txt
```
하지만 이렇게 간단한 작업을 수행하기에는 너무 복잡합니다. awk는 입력을 밑줄로 구분된 필드로 분할할 수 있으므로 이를 수행하는 것이 더 쉽습니다.
```
awk -F'_' -e '{print $1 "_" $2 " " $0}' samples_long.10ids.txt
```

Question 2

신인의 awk실수...

awk파일을 매개변수로 전달합니다.

gawk [POSIX 또는 GNU 스타일 옵션] [ -- ] 프로그램 텍스트문서...

Answer

신인의 awk실수...

awk파일을 매개변수로 전달합니다.

gawk [POSIX 또는 GNU 스타일 옵션] [ -- ] 프로그램 텍스트문서...

awk 변수로 교체

답변1

답변2

관련 정보