특정 열의 GREP 대문자, 결과를 새 열과 동일한 파일로 파이프

Question 1

열을 지정하기 위해 grep에 옵션이나 매개변수가 있습니까?

grep아니요필드 구분 기호옵션.
다음을 사용하십시오앗반대 접근 방식:

awk -F'\t' -v OFS='\t' '{match($19,/[A-Z]+/); $20=substr($19,RSTART,RLENGTH) FS $20}1' 1.table

match($19,/[A-Z]+/)- 필드 19에서 대문자 캡처

$20=substr($19,RSTART,RLENGTH) FS $20- 일치하는 대문자를 추출합니다.19번째 필드를 다음과 같이 삽입하십시오.20첫 번째 필드 값

Answer

열을 지정하기 위해 grep에 옵션이나 매개변수가 있습니까?

grep아니요필드 구분 기호옵션.
다음을 사용하십시오앗반대 접근 방식:

awk -F'\t' -v OFS='\t' '{match($19,/[A-Z]+/); $20=substr($19,RSTART,RLENGTH) FS $20}1' 1.table

match($19,/[A-Z]+/)- 필드 19에서 대문자 캡처

$20=substr($19,RSTART,RLENGTH) FS $20- 일치하는 대문자를 추출합니다.19번째 필드를 다음과 같이 삽입하십시오.20첫 번째 필드 값

Question 2

이 작업을 수행하는 방법에 대한 문자 그대로의 질문에 대답하려면grep 홀로. grep이를 위해 설계되지는 않았지만 GNU를 사용 하고 grepPCRE 지원으로 빌드하면 다음을 수행할 수 있습니다.

grep -Po '(?:^(?:[^\t]*\t){18}|\G)[^\t]*?\K[[:upper:]]'

<not-TABs><tab>즉, 줄의 시작 부분이나 이전 일치 항목의 끝 부분에서 18개 시퀀스( )를 검색하고 \G그 뒤에 탭이 아닌 문자가 가능한 한 적고(따라서 여전히 19번째 필드에 있음) 대문자가 뒤따릅니다. \K우리는 재설정일치대문자 앞부분입니다.

따라서 다음과 같은 입력을 위해:

X<tab>X<tab>....<tab>AbC<tab>X<tab>...

다음과 같이 보고됩니다.

A
C

당신이하는 방법과 같습니다 cut | grep.

필드 19의 첫 번째 대문자에만 관심이 있는 경우 이를 다음과 같이 단순화할 수 있습니다.

grep -Po '^(?:[^\t]*\t){18}[^\t]*?\K[[:upper:]]'

20번째로 넣어주세요기둥, 다음과 같이 할 수 있습니다.

paste <(cut -f1-19 < file) <(grep ...above < file) <(cut -f20- < file) > newfile

또는 마지막 열로 삽입하십시오.

grep... < file | paste file - > newfile

Answer