시퀀스 파일의 헤더 구문 분석

시퀀스 파일의 헤더 구문 분석

여러 시퀀스 파일이 있습니다.

>abc|d017961
sequence1......

>cdf|rhtdm9
sequence2......

>ijm|smthr12
sequence3......

>abc|d011wejr
sequence4......

>stg|eethwe77
sequence5......

파일을 편집하고 결과 파일을 다음과 같이 만들고 싶습니다.

>abc_ABC__d017961
sequence1......

>cdf_CDF__rhtdm9
sequence2......

>ijm_IJM__smthr12
sequence3......

>abc_ABC__d011wejr
sequence4......

>stg_STG__eethwe77
sequence5......

답변1

GNU 사용 sed:

sed 's/>\([^|]*\)|/>\1_\U\1__/'

다음과 동일 perl:

perl -pe's/>(.*?)\|/>$1_\U$1__/'

관련 정보