码迷,mamicode.com
首页 > 其他好文 > 详细

NCBI下载SRA数据

时间:2018-02-26 17:36:13      阅读:1710      评论:0      收藏:0      [点我收藏+]

标签:ast   wget   size   一个   内容   lis   根据   body   输入   

从NCBI下载数据本来是一件很简单的事情,但是今天碰到几个坑:

1、paper里没有提供SRA数据号、也没有提供路径;

2、不知道文件在ftp的地址,不能直接用wget下载

 

所以通过在NCBI官网,直接在SRA搜索栏里:

技术分享图片

输入paper的title关键词NIFTY BGI

技术分享图片

搜索结果:

 技术分享图片

选一个文件点击进去

技术分享图片

 

 进去之后,再点击SRP

技术分享图片

然后:

技术分享图片

出现如下内容:

技术分享图片

然后选择所有SRR文件:

技术分享图片

下载Accession list之后得到文件列表:

SRR354208
SRR357358
SRR357397
SRR357398
SRR357666
SRR357667
SRR357668
SRR357669
SRR357670
SRR357671
SRR357672
SRR357673
SRR357674
SRR357675
SRR357676

然后根据这个列表在linux下载:

[wuzengding@mn01 NIFTY_BGI_samp]$ cat /data1/Medicine/WZD/SRR_Acc_List.txt | while read line
> do
> echo $line
> /home/wuzengding/biosoftware/sratoolkit.2.8.2-1-centos_linux64/bin/fastq-dump.2.8.2 ${line}
> done

 下载成功!!

 

注:另外一种更简单方法

在找到这个界面时

技术分享图片

点击send to

技术分享图片

 

 最后得到SraRunInfo.csv文件,文件内容是各个samp sequence的列表信息,包括FTP上的下载地址:

技术分享图片

然后在linux中下载,

完毕!

 

NCBI下载SRA数据

标签:ast   wget   size   一个   内容   lis   根据   body   输入   

原文地址:https://www.cnblogs.com/zdwu/p/8473986.html

(0)
(2)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!