码迷,mamicode.com
首页 > 其他好文 > 详细

RepBaseRepeatMaskerEdition下载 | RepeatMasker

时间:2018-03-27 01:57:23      阅读:1515      评论:0      收藏:0      [点我收藏+]

标签:sed -e   efault   sub   targe   raw   tps   highlight   使用   .gz   

开源的生物信息世界居然有这么个需要注册才能下载的工具,开源世界不是怎么方便怎么来吗?

这个注册真的麻烦,这里上传了一个可以使用的版本。

 

RepBaseRepeatMaskerEdition-20170127.tar.gz

 

想转成fasta可以用如下命令:

awk -f awk.sh RMRBSeqs.embl > raw.fasta
cat raw.fasta | cut -f1-9 -d‘ ‘| sed -e ‘s/ID   //g‘ | sed -e ‘s/repeatmasker\;//g‘| sed -e ‘s/ //g‘ > RepBase.fasta

 

其中awk.sh文件内容为:

/^ID/   {printf(">%s;",$0); next;}
/^(PT|PA)/  {printf(" %s;",$0); next;}
/^\/\// {printf("\n"); next;}
/^    / {printf("\n%s",substr($0,5)); next;}
    {
    /* ignore default */
    }
END   {
    printf("\n");
    }

  

RepBaseRepeatMaskerEdition下载 | RepeatMasker

标签:sed -e   efault   sub   targe   raw   tps   highlight   使用   .gz   

原文地址:https://www.cnblogs.com/leezx/p/8654838.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!