>GDRLR5L04EQY8D 3931|1166 스트림을 >3931로 편집

Question 1

사용 awk:

awk -F'[| ]' '{if ( $1 ~ /^>/ ) print ">"$2; else print $0}' file
>3931
GACAAACGCTGGCGGGTGCATGAG

파이프 앞의 첫 번째 문자열 끝과 숫자 집합의 시작 사이의 공백이 a Tab대신 a 인 경우 Space필드 구분 기호를 설정하는 정규 표현식은 입니다 [|\t].

Answer

사용 awk:

awk -F'[| ]' '{if ( $1 ~ /^>/ ) print ">"$2; else print $0}' file
>3931
GACAAACGCTGGCGGGTGCATGAG

파이프 앞의 첫 번째 문자열 끝과 숫자 집합의 시작 사이의 공백이 a Tab대신 a 인 경우 Space필드 구분 기호를 설정하는 정규 표현식은 입니다 [|\t].

Question 2

sed 솔루션:

sed '/^>/s/>.* \([0-9]*\)|.*/>\1/' < existing-file > new-file

이로 인해 그 뒤의 명령이 >로 시작하는 입력 행에서만 작동하게 되는데, 이는 수행할 수 있는지 /^>/모르는 것 같습니다 .sed

Answer

sed 솔루션:

sed '/^>/s/>.* \([0-9]*\)|.*/>\1/' < existing-file > new-file

이로 인해 그 뒤의 명령이 >로 시작하는 입력 행에서만 작동하게 되는데, 이는 수행할 수 있는지 /^>/모르는 것 같습니다 .sed

Question 3

다른 sed:

$ sed -e 's/[^>].* \([0-9]*\)|.*/\1/' file
>3931
GACAAACGCTGGCGGGTGCATGAG

Answer

다른 sed:

$ sed -e 's/[^>].* \([0-9]*\)|.*/\1/' file
>3931
GACAAACGCTGGCGGGTGCATGAG

Question 4

sed 's/>.* />/;s/|.*//
' <<\DATA
>GDRLR5L04EQY8D 3931|1166
GACAAACGCTGGCGGGTGCATGAG
DATA

>3931
GACAAACGCTGGCGGGTGCATGAG

Answer

sed 's/>.* />/;s/|.*//
' <<\DATA
>GDRLR5L04EQY8D 3931|1166
GACAAACGCTGGCGGGTGCATGAG
DATA

>3931
GACAAACGCTGGCGGGTGCATGAG

관련 정보