주어진 열의 내용이 변경될 때마다 파일 분할

Question 1

사용awk

$ awk -F"|" '{print > $2}' input_file
$ head gene_cluster*
==> gene_cluster:GC_00001105 <==
>00000000|gene_cluster:GC_00001105|genome_name:r7534_20160316|gene_callers_id:24
>00000001|gene_cluster:GC_00001105|genome_name:r7537_20160321|gene_callers_id:78
>00000002|gene_cluster:GC_00001105|genome_name:r7541_20160426|gene_callers_id:774
>00000003|gene_cluster:GC_00001105|genome_name:r7544_20160502|gene_callers_id:1034
>00000004|gene_cluster:GC_00001105|genome_name:r7547_20160512|gene_callers_id:330
>00000005|gene_cluster:GC_00001105|genome_name:r7550_20160517|gene_callers_id:2094

==> gene_cluster:GC_00001290 <==
>00000006|gene_cluster:GC_00001290|genome_name:r7534_20160316|gene_callers_id:76
>00000007|gene_cluster:GC_00001290|genome_name:r7537_20160321|gene_callers_id:358
>00000008|gene_cluster:GC_00001290|genome_name:r7541_20160426|gene_callers_id:1601
>00000009|gene_cluster:GC_00001290|genome_name:r7544_20160502|gene_callers_id:2134

Answer

사용awk

$ awk -F"|" '{print > $2}' input_file
$ head gene_cluster*
==> gene_cluster:GC_00001105 <==
>00000000|gene_cluster:GC_00001105|genome_name:r7534_20160316|gene_callers_id:24
>00000001|gene_cluster:GC_00001105|genome_name:r7537_20160321|gene_callers_id:78
>00000002|gene_cluster:GC_00001105|genome_name:r7541_20160426|gene_callers_id:774
>00000003|gene_cluster:GC_00001105|genome_name:r7544_20160502|gene_callers_id:1034
>00000004|gene_cluster:GC_00001105|genome_name:r7547_20160512|gene_callers_id:330
>00000005|gene_cluster:GC_00001105|genome_name:r7550_20160517|gene_callers_id:2094

==> gene_cluster:GC_00001290 <==
>00000006|gene_cluster:GC_00001290|genome_name:r7534_20160316|gene_callers_id:76
>00000007|gene_cluster:GC_00001290|genome_name:r7537_20160321|gene_callers_id:358
>00000008|gene_cluster:GC_00001290|genome_name:r7541_20160426|gene_callers_id:1601
>00000009|gene_cluster:GC_00001290|genome_name:r7544_20160502|gene_callers_id:2134

Question 2

awk -F'|' '$2 != out{close(out); out=$2} {print > out}'

각 출력 파일을 닫지 않으면 동시에 열린 파일의 임계값이 초과되면 awk 버전에 따라 awk 스크립트가 실패하거나 크게 느려집니다. 예를 참조하세요.SSL 인증서를 분할할 때 오류가 발생했습니다. 출력 파일이 너무 많습니다. 10또는awk-cannot-open-04477c9a875b80-csv-for-output-too-many-open-files

Answer

awk -F'|' '$2 != out{close(out); out=$2} {print > out}'

각 출력 파일을 닫지 않으면 동시에 열린 파일의 임계값이 초과되면 awk 버전에 따라 awk 스크립트가 실패하거나 크게 느려집니다. 예를 참조하세요.SSL 인증서를 분할할 때 오류가 발생했습니다. 출력 파일이 너무 많습니다. 10또는awk-cannot-open-04477c9a875b80-csv-for-output-too-many-open-files

주어진 열의 내용이 변경될 때마다 파일 분할

답변1

답변2

관련 정보