다른 파일의 ID를 사용하여 gff3 파일에서 데이터를 추출하는 방법은 무엇입니까?

Question

@Hari 예상되는 출력을 보지 않고 표준 gff3 파일을 사용해 보았습니다. 그러나 내 스크립트는 "#startgene" 및 "#endgene" 줄을 인쇄하지 않습니다. 이것이 당신에게 도움이 되기를 바랍니다

Code:
#!/usr/local/perl

use strict;
use warnings;

my $file1 = $ARGV[0];
my $file2 = $ARGV[1];
my $output_file = $ARGV[2];

my %id;
my $ctr = 0;
open(IN, $file1);
while(<IN>)
{

    $_ =~ s/\n|\r//g;
    $ctr++;
    $id{$_} = $ctr;
}
close IN;

open(IN, $file2);
open(OUT, ">".$output_file);
while(<IN>)
{
    $_ =~ s/\n|\r//g;

    if($_ !~ /^#/)
    {
        my @tmp = split(/\t/, $_);

        if($tmp[8] =~ /ID=g(\d+)/)
        {
            my $gene_id = "g".$1;
            if(exists $id{$gene_id})
            {
                print OUT $_."\n";
            }
        }
        elsif($tmp[8] =~ /Parent=g(\d+)\.t(\d+)/)
        {
            my $gene_id = "g".$1;
            if(exists $id{$gene_id})
            {
                print OUT $_."\n";
            }
        }
    }
}
close IN;
close OUT;

Answer 1

@Hari 예상되는 출력을 보지 않고 표준 gff3 파일을 사용해 보았습니다. 그러나 내 스크립트는 "#startgene" 및 "#endgene" 줄을 인쇄하지 않습니다. 이것이 당신에게 도움이 되기를 바랍니다

Code:
#!/usr/local/perl

use strict;
use warnings;

my $file1 = $ARGV[0];
my $file2 = $ARGV[1];
my $output_file = $ARGV[2];

my %id;
my $ctr = 0;
open(IN, $file1);
while(<IN>)
{

    $_ =~ s/\n|\r//g;
    $ctr++;
    $id{$_} = $ctr;
}
close IN;

open(IN, $file2);
open(OUT, ">".$output_file);
while(<IN>)
{
    $_ =~ s/\n|\r//g;

    if($_ !~ /^#/)
    {
        my @tmp = split(/\t/, $_);

        if($tmp[8] =~ /ID=g(\d+)/)
        {
            my $gene_id = "g".$1;
            if(exists $id{$gene_id})
            {
                print OUT $_."\n";
            }
        }
        elsif($tmp[8] =~ /Parent=g(\d+)\.t(\d+)/)
        {
            my $gene_id = "g".$1;
            if(exists $id{$gene_id})
            {
                print OUT $_."\n";
            }
        }
    }
}
close IN;
close OUT;

다른 파일의 ID를 사용하여 gff3 파일에서 데이터를 추출하는 방법은 무엇입니까?

답변1

관련 정보