码迷,mamicode.com
首页 > 其他好文 > 详细

筛选染色体连续区域的策略

时间:2017-05-18 16:53:27      阅读:191      评论:0      收藏:0      [点我收藏+]

标签:type   染色体   foreach   gen   函数   突变   信息   连续   变量   

要求:筛选染色体上符合要求的连续的纯合突变区域。perl  (/(ㄒoㄒ)/~~现在只会用perl)

笨办法,正则匹配:

举例子1:

my $info=(HOMA,871334,HET,874950,HOMA,876499,HOMA,887643);

while($info =~ /((HOMA,(\d+),){2,})/g){
        print "$1\n"; ##$1是输出大括号内的内容,所有符合要求的具有连续连续至少两次纯合突变的区域被筛选出来啦
}

举例子2:

因为是按照染色体的位置顺序依次判断,预先设置一个变量来判断“区域中断点”,先设置为空,将读进去的区域第一个符合要求的变量赋给他,不同即为断点,判断之前存储的区域是否符合要求即可,然后从断点后继续筛选,将符合要求的纯合突变赋值给“断点”。。。

my @getpos=();##存储连续的homa位置信息
my $lasttype="";

foreach my $pos(@sortpos){##排好顺序的位置
          my $geno=$$hash{$chr}{$pos}{‘geno‘};
          if($geno ne $lasttype){
              if($lasttype eq ""){
                 if($geno eq ‘HOMA‘){
                  push @getpos,$pos;
                  $lasttype=‘HOMA‘;
                  next;
                 }
             }else{
                 check();##子函数检查模块
                 $lasttype="";
                 @getpos=();
             }
        }else{
            push @getpos,$pos;
            }
 }

 

 

bingo!!!

筛选染色体连续区域的策略

标签:type   染色体   foreach   gen   函数   突变   信息   连续   变量   

原文地址:http://www.cnblogs.com/gui-/p/6873906.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!