Hadoop的一大基本原则是移动计算的开销要比移动数据的开销小。因此,Hadoop通常是尽量移动计算到拥有数据的节点上。这就使得Hadoop中读取数据的客户端DFSClient和提供数据的Datanode经常是在一个节点上,也就造成了很多“Local Reads”。本文将介绍在优化Local Reads的一些方案。...
分类:
其他好文 时间:
2014-10-17 18:50:01
阅读次数:
310
在对之前的ITS数据(454数据)做split时,发现有一些reads没有被匹配上,但是barcode能够完全匹配,虽然之后的primer在中间漏了一个碱基,导致后面的碱基全部误匹配,从而导致这条reads没有被匹配上的问题。终于解决Qiime的问题后,使用split_libraries.py 做切...
分类:
其他好文 时间:
2014-10-13 18:22:41
阅读次数:
147
由于Qiime出了点问题,ITS项目先缓几天,这两天先忙着做meta的内容。物种丰度计算准备工作:1 使用SOAPAligner对过滤好的数据进行比对,得到相应的.soap文件,里面记录匹配到的reads的情况;2 还需要将所有用到的reference做一个TAX,tax文件记录referenc.....
分类:
其他好文 时间:
2014-10-11 17:07:18
阅读次数:
464
鲤鱼基因组:http://www.ntv.cn/a/20140923/52953.shtml关于鲤鱼基因组的测定,数据质量控制遭到质疑。Why you should QC your reads AND your assembly?Graham Etheringtonhttp://grahamethe...
分类:
其他好文 时间:
2014-10-05 13:53:28
阅读次数:
158
rnacallvarients时gatk推荐工具,broad institute都推荐了,还是encode计划时冷泉港内部开发的,特点:快速、as支持性好、支持长reads、全转录本、发现嵌合转录本等,有理由看一下。百度了下,没中文的博文,我来翻译一个吧……####################原...
分类:
其他好文 时间:
2014-10-03 13:24:34
阅读次数:
965
1.将多表连接拆分成较小的几个部分顺序执行
2.用内连接代替外连接。
3.优先直线哪些能大大减少返回行的操作,再将生产的临时表与其他表进行左连接。
4.修改like程序,去掉%,因为有%无法使用索引。
5.使用存储过程封装哪些复杂的SQL logical reads语句或商业逻辑。...
分类:
数据库 时间:
2014-09-29 14:23:30
阅读次数:
281
前期准备(版本匹配):Hadoop 2.x is faster and includes features, such as short-circuit reads, which will help improve your HBase random read profile. Hadoop 2.x...
分类:
其他好文 时间:
2014-09-19 22:22:26
阅读次数:
368
在MySQL主从复制机器的master的数据库中创建function,报出如下错误:
Error Code: 1418. This function has none of DETERMINISTIC, NO SQL, or READS SQL DATA in its declaration and binary logging is enabled
(you *might* want to...
分类:
数据库 时间:
2014-09-19 17:38:05
阅读次数:
210
mysql默认是不能自定义函数的当create function时This function has none of DETERMINISTIC, NO SQL, or READS SQL DATA in its declaration and binarysolution 1:exec:SET G...
分类:
数据库 时间:
2014-09-18 11:06:03
阅读次数:
320
A method and apparatus for preservingmemoryordering in a cache coherent link based interconnect in light of partial and non-coherentmemoryaccesses is ...
分类:
数据库 时间:
2014-09-05 19:37:41
阅读次数:
373