열의 특정 패턴을 기반으로 데이터 추출

Question 1

기본적으로 awk에서는 필드가 공백으로 구분되어야 합니다. 파일이 쉼표로 구분된 경우 명령 -F줄 옵션을 사용하거나 내부 awk 변수를 설정하여 FS필드 구분 기호를 적절하게 설정 해야 합니다.

출력을 쉼표로 구분하려면 이를 설정해야 합니다 OFS.

전임자.

$ awk -F, 'BEGIN{OFS=FS} $3 ~ /^MT-/ {print $1, $2, $3, $4}' final_matrix.csv
AAACCTGCAAGCGAGT-1,ENSG00000002549,MT-CO3,2
AAACCTGCAAGCGAGT-1,ENSG00000003402,MT-CYB,2

Answer

기본적으로 awk에서는 필드가 공백으로 구분되어야 합니다. 파일이 쉼표로 구분된 경우 명령 -F줄 옵션을 사용하거나 내부 awk 변수를 설정하여 FS필드 구분 기호를 적절하게 설정 해야 합니다.

출력을 쉼표로 구분하려면 이를 설정해야 합니다 OFS.

전임자.

$ awk -F, 'BEGIN{OFS=FS} $3 ~ /^MT-/ {print $1, $2, $3, $4}' final_matrix.csv
AAACCTGCAAGCGAGT-1,ENSG00000002549,MT-CO3,2
AAACCTGCAAGCGAGT-1,ENSG00000003402,MT-CYB,2

Question 2

모든 답은 정확하며, 전체 줄을 인쇄할 수도 있습니다.

그리고 필드 구문 분석이 필요하지 않습니다.

awk  '/,MT-/{print}' final_matrix.csv

Answer

모든 답은 정확하며, 전체 줄을 인쇄할 수도 있습니다.

그리고 필드 구문 분석이 필요하지 않습니다.

awk  '/,MT-/{print}' final_matrix.csv

Question 3

아이디어는 정확하지만 열 항목을 나머지 열과 구별 awk되도록 분리하는 방법을 표시하는 것을 잊었습니다 . 이제는 텍스트를 구분하기 위한 공백만 찾고 있지만 결국 전체 줄을 찾게 되는데 , 이는 전혀 발견되지 않습니다 . 따라서 이것은 단지 오류 조건으로 인해 발생하는 것입니다.$1$2$1$3$3 ~ ..전혀인쇄할 줄 수입니다.

awk -v FS=, -v OFS=, '$3 ~/^MT-/ {print $1, $2, $3, $4}' final_matrix.csv

Answer

아이디어는 정확하지만 열 항목을 나머지 열과 구별 awk되도록 분리하는 방법을 표시하는 것을 잊었습니다 . 이제는 텍스트를 구분하기 위한 공백만 찾고 있지만 결국 전체 줄을 찾게 되는데 , 이는 전혀 발견되지 않습니다 . 따라서 이것은 단지 오류 조건으로 인해 발생하는 것입니다.$1$2$1$3$3 ~ ..전혀인쇄할 줄 수입니다.

awk -v FS=, -v OFS=, '$3 ~/^MT-/ {print $1, $2, $3, $4}' final_matrix.csv

Question 4

게시한 예를 고려하면 다음과 같이 할 수 있습니다.

grep ',MT-/' final_matrix.csv

그러나 awk를 사용하고 세 번째 필드에 집중하려면 다음과 같습니다.

awk -F, '$3 ~ /^MT-/' final_matrix.csv

또는:

awk -F, 'index($3,"MT-")==1' final_matrix.csv

Answer

게시한 예를 고려하면 다음과 같이 할 수 있습니다.

grep ',MT-/' final_matrix.csv

그러나 awk를 사용하고 세 번째 필드에 집중하려면 다음과 같습니다.

awk -F, '$3 ~ /^MT-/' final_matrix.csv

또는:

awk -F, 'index($3,"MT-")==1' final_matrix.csv

열의 특정 패턴을 기반으로 데이터 추출

답변1

답변2

답변3

답변4

관련 정보