16초와 23초가 있는 경우 파일을 분할하는 Perl 코드입니다. 그리고 파일로 복사

Question 1

awk죄송합니다. 이 문제를 해결하기 위해 Perl을 사용하겠습니다.

/^\/\// && file { file = file ".out";
                  print section ORS $0 >file;
                  file = "" }

/^description/ && match($0, p) && file = substr($0,RSTART,RLENGTH) {}

/^start/        { section = $0; next       }
                { section = section ORS $0 }

데이터에 대해 다음을 실행하십시오( p='expression'원하는 부분을 선택하는 데 사용할 수 있음).

$ awk -f script.awk p='16S|23S' file.in
$ ls -l
total 16
-rw-r--r--  1 kk  wheel   64 Aug 28 12:10 16S.out
-rw-r--r--  1 kk  wheel   56 Aug 28 12:10 23S.out
-rw-r--r--  1 kk  wheel  176 Aug 28 11:51 file.in
-rw-r--r--  1 kk  wheel  276 Aug 28 12:09 script.awk
$ cat 16S.out
start
description Human 16S rRNA
**some text**
**some text**
//
$ cat 23S.out
start
description Mouse 23S rRNA
some text
some text
//

섹션 끝 마커( 로 시작하는 줄)를 찾고 //출력 파일 이름( file)이 비어 있지 않으면 스크립트의 첫 번째 블록이 실행됩니다. 현재 파일 이름에 추가 .out하고 저장된 부분을 파일에 출력한 다음 현재 입력 줄을 출력합니다. 그런 다음 변수를 지웁니다 file.

두 번째 블록은 비어 있지만 패턴은 description및 로 시작하는 줄과 일치하며 계속해서 p명령줄에 제공된 정규식( )과 해당 줄을 일치시킵니다. 일치하는 부분이 있으면 일치하는 부분을 골라 파일명으로 사용합니다.

해당 단어로 시작하는 줄을 찾으면 세 번째 블록이 실행되고 start저장된 섹션 텍스트를 현재 줄로 설정하고 그 안에 저장된 이전 텍스트를 모두 삭제합니다. 그런 다음 스크립트의 시작 부분으로 이동하여 다음 입력 줄을 고려합니다.

마지막 블록은 파일의 다른 모든 줄에 대해 실행되고 현재 줄을 현재 저장된 섹션에 추가합니다.

Answer

awk죄송합니다. 이 문제를 해결하기 위해 Perl을 사용하겠습니다.

/^\/\// && file { file = file ".out";
                  print section ORS $0 >file;
                  file = "" }

/^description/ && match($0, p) && file = substr($0,RSTART,RLENGTH) {}

/^start/        { section = $0; next       }
                { section = section ORS $0 }