fastq 파일이 있는데 특정 줄의 첫 번째 문자를 제외한 모든 항목을 제거해야 합니다. 예는 다음과 같습니다.
@A202BNABXX:2:1:4523:2219/1
GGCCGAATTCACCGATAAAATACACAGACGGTAAATGTTCCCACTAGGTTCACCTATGAGTCCGCTATGCCCGCCGGCATTTCAATTTCT
+ERR706845.1.1 A202BNABXX:2:1:4523:2219 length=90
@A202BNABXX:2:1:4715:2246/1
CTGAGGACTGCATGACATGGACTGATGCACTCTATAATCATTTTAATGCAATTGTCACTATTCATGAAATTGTGTAACTTACTAAATAGT
+ERR706845.2.1 A202BNABXX:2:1:4715:2246 length=90
더하기 기호는 fastq 파일의 줄 시작 부분에 있습니다. 해당 기호로 시작하는 각 줄에 대해 +
그 뒤의 모든 항목을 삭제해야 합니다. 그런 다음 출력을 새 파일로 다시 작성해야 합니다. 어떤 조언이라도 대단히 감사하겠습니다. 매우 감사합니다!
답변1
사용sed
$ sed -E 's/^(\+).*/\1/' input_file > new_file
$ cat new_file
@A202BNABXX:2:1:4523:2219/1
GGCCGAATTCACCGATAAAATACACAGACGGTAAATGTTCCCACTAGGTTCACCTATGAGTCCGCTATGCCCGCCGGCATTTCAATTTCT
+
@A202BNABXX:2:1:4715:2246/1
CTGAGGACTGCATGACATGGACTGATGCACTCTATAATCATTTTAATGCAATTGTCACTATTCATGAAATTGTGTAACTTACTAAATAGT
+