还是跟小孩一样,喜欢玩,尤其是这种搭积木的游戏,其实真的没什么技术含量。 但科研分析是反标准化的,如果你的paper只是pipeline出来的,那最多也就3分。 有必要搭建流程吗? 就一批小数据,那就随便搞,没必要标准化流程 经常拿到新data,那就可以考虑一下了,一键执行很快乐 公司级别的业务,持 ...
分类:
其他好文 时间:
2021-05-24 08:58:48
阅读次数:
0
动态规划(英语:Dynamic programming,简称 DP)是一种在数学、管理科学、计算机科学、经济学和生物信息学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。 动态规划不是某一种具体的算法,而是一种算法思想: 若要解一个给定问题,我们需要解其不同部分(即子问题),再 ...
分类:
其他好文 时间:
2021-04-06 15:07:31
阅读次数:
0
为了获得1000美元的基因组,是否以牺牲质量为代价?新系列的长读测序的崛起 作者:Theral Timpson根据2010年发表在《生物信息技术世界》(Bio-IT World)上的一篇文章,“1000美元基因组”这个词早在2001年就出现了。威斯康辛大学的大卫·施瓦茨声称,他是在美国国家人力资源研 ...
分类:
其他好文 时间:
2020-10-05 22:25:33
阅读次数:
30
注:这几个名词是RNA-Seq数据分析中的基础,在此小结一下。 在RNA-Seq的分析中,对基因或转录本的read counts数目进行标准化(normalization)是一个极其重要的步骤,因为落在一个基因区域內的read counts数目取决于基因长度和测序深度。很容易理解:一个基因越长、测序 ...
分类:
其他好文 时间:
2020-07-06 16:08:29
阅读次数:
273
由于之前做的都是用深度学习做数据融合方面以及NLP方面的东西,虽然NLP做的不是很深入,但是基本用的都是深度学习那一套,都是处理时许序列和序列预训练。
[有一个综述类文章总结的多组学方面的方向](https://blog.csdn.net/xunan003/article/details/78836... ...
分类:
其他好文 时间:
2020-06-24 21:41:44
阅读次数:
125
就职在一家物联网平台公司,刚入职熟悉业务的时候负责过嵌入式的测试。由于嵌入式测试比较偏门,就和大家聊一聊嵌入式测试和常见的软件测试有什么区别。 [ ] 嵌入式产品类型 安防行业 通过车载摄像头的数据进行实时传输达到的视频云监控,对周边路口进行实时预警,盲区监测等。 通过采集用户生物信息达到的智能门禁 ...
分类:
其他好文 时间:
2020-05-11 23:32:12
阅读次数:
69
简介 字符串的模式匹配是对字符串的基本操作之一,广泛应用于生物信息学、信息检索、拼写检查、语言翻译、数据压缩、网络入侵检测等领域,如何简化其复杂性一直是算法研究中的经典问题。字符串的模式匹配实质上就是寻找模式串P是否在主串T 中,且其出现的位置。我们对字符串匹配的效率的要求越来越高, 应不断地改良模 ...
分类:
编程语言 时间:
2020-04-30 21:15:28
阅读次数:
77
欢迎来到"bio生物信息"的世界 之前的推文 "GWAS: 曼哈顿图,QQ plot 图,膨胀系数( manhattan、Genomic Inflation Factor)" 写过如何用qqman包做曼哈顿图。 但众所周知(据我说知),这个包画图很丑,尤其想highlight显著位点时,屎一样的绿色 ...
分类:
其他好文 时间:
2020-04-17 23:26:06
阅读次数:
345
GTF 全称是gene transfer format,主要是对染色体上的基因进行标注。怎么理解呢,其实所谓的基因名,基因座等,都只是后来人们给一段DNA序列起的名字而已,还原到细胞中就是细胞核里面的一条长长的染色体(DNA序列)。而这个GTF文件的主要功能,就是指出我们所谓的基因在染色体上的位置( ...
分类:
其他好文 时间:
2020-03-17 14:20:40
阅读次数:
91
NCBI National Center for Biotechnology Information:美国国立生物技术信息中心,包含PubMed、GenBank、RefSeq、GEO这些数据库;搜索引擎:Entrez;比对工具:BLAST 详细介绍:除了建有GenBank核酸序列数据库(该数据库的数 ...
分类:
数据库 时间:
2020-03-17 14:10:53
阅读次数:
902