sed, awk 또는 vim을 사용하여 +로 시작하는 줄에서 +를 제외한 모든 항목을 삭제하세요.

sed, awk 또는 vim을 사용하여 +로 시작하는 줄에서 +를 제외한 모든 항목을 삭제하세요.

fastq 파일이 있는데 특정 줄의 첫 번째 문자를 제외한 모든 항목을 제거해야 합니다. 예는 다음과 같습니다.

@A202BNABXX:2:1:4523:2219/1
GGCCGAATTCACCGATAAAATACACAGACGGTAAATGTTCCCACTAGGTTCACCTATGAGTCCGCTATGCCCGCCGGCATTTCAATTTCT
+ERR706845.1.1 A202BNABXX:2:1:4523:2219 length=90
@A202BNABXX:2:1:4715:2246/1
CTGAGGACTGCATGACATGGACTGATGCACTCTATAATCATTTTAATGCAATTGTCACTATTCATGAAATTGTGTAACTTACTAAATAGT
+ERR706845.2.1 A202BNABXX:2:1:4715:2246 length=90

더하기 기호는 fastq 파일의 줄 시작 부분에 있습니다. 해당 기호로 시작하는 각 줄에 대해 +그 뒤의 모든 항목을 삭제해야 합니다. 그런 다음 출력을 새 파일로 다시 작성해야 합니다. 어떤 조언이라도 대단히 감사하겠습니다. 매우 감사합니다!

답변1

사용sed

$ sed -E 's/^(\+).*/\1/' input_file > new_file
$ cat new_file
@A202BNABXX:2:1:4523:2219/1
GGCCGAATTCACCGATAAAATACACAGACGGTAAATGTTCCCACTAGGTTCACCTATGAGTCCGCTATGCCCGCCGGCATTTCAATTTCT

+

@A202BNABXX:2:1:4715:2246/1
CTGAGGACTGCATGACATGGACTGATGCACTCTATAATCATTTTAATGCAATTGTCACTATTCATGAAATTGTGTAACTTACTAAATAGT

+

관련 정보