坐标:北京
职位:
技术研发类:搜索研发工程师 支付风险控制/数据挖掘
广告研发工程师 图像处理工程师
技术研发类:自然语言处理工程师 数学建模工程师
机器学习/数据挖掘 PHP开发工程师
技术研发类:Hadoop数据研发工程师 检索/存储架构工程师
前端开发工程师 即时通讯(IM)(C++)
技术研发类:JAVA研发工程师 安全工程师
Hadoop运维工程师 DBA开发工程师
...
分类:
其他好文 时间:
2015-05-27 22:51:33
阅读次数:
360
学习matlab实属是机缘巧合,因为要参加一个大学生的数学建模大赛,而这个比赛必备的软件方面的技能就是matlab。通过几天的实践与学习,我发现与C、java语言等语言相比,matlab所使用的代码无疑是简单了许多的。下面,我就将几天的学习体验分享一下。安装:首先我使用的版本是matlab2012a...
分类:
其他好文 时间:
2015-05-24 01:22:42
阅读次数:
161
1,关于时间序列时间序列分析(Time series analysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。关于R环境搭建参考我之前写的文章...
分类:
编程语言 时间:
2015-05-19 00:51:22
阅读次数:
2170
R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的。在那儿可以下载到R的安装程序、各种外挂程序和文档。为啥用R语言呢,具体做数据分析,做报表看趋势,需要的数据都不是太多,用R足够了。感觉hadoop是数据处理,将计算结果再做分析的时候使用R。相互结合起来使用更高效,hadoop的优势是大数据,R的优势是数据统计函数方便,展示图标方便。所以两个结合起来使用最好。...
分类:
编程语言 时间:
2015-05-18 20:52:02
阅读次数:
10454
这个问题来自 DNA序列的k-mer index问题。
给定一个DNA序列,这个系列只含有4个字母ATCG,如 S =“CTGTACTGTAT”。给定一个整数值k,从S的第一个位置开始,取一连续k个字母的短串,称之为k-mer(如k= 5,则此短串为CTGTA), 然后从S的第二个位置, 取另一k-mer(如k= 5,则此短串为TGTAC),这样直至S的末端,就得一个集合,包含全部k-mer 。...
分类:
其他好文 时间:
2015-05-16 09:06:59
阅读次数:
92
上周三,上完思修课后我和小组成员争分夺秒地赶制了数模竞赛的程序。刚完事儿不久,笔记本就没电了。中午去实验室插上电,又把报告赶了出来,下午打印好后交了上去。 Deadline真是第一生产力。数学建模很早就有所耳闻,感觉是非常有意思的一种比赛。据我前期了解,A题一般是连续的题,B题是离散的题,C题则是和...
分类:
其他好文 时间:
2015-05-14 20:03:29
阅读次数:
885
这是一个山科大的同学给我的一个问题,向我询问一下思路,对于数学建模,我没太多的了解,所以只能用计算机程序的方法来解答。
这是具体的问题:
这个问题来自 DNA序列的k-mer index问题。
给定一个DNA序列,这个系列只含有4个字母ATCG,如 S =“CTGTACTGTAT”。给定一个整数值k,从S的第一个位置开始,取一连续k个字母的短串,称之为k-mer(如k= 5,则此短串为C...
分类:
其他好文 时间:
2015-05-12 13:40:44
阅读次数:
723
参考《算法导论第二版P222页)一,如何把现实的问题转变成数学问题?即数学建模的思路?1,问题描述:现有一组相互竞争的活动,如何调度能够找出一组最大的活动(活动数目最多)使得它们相互兼容?2,问题转化:首先,按活动的结束时间单调递增进行排序。那么,为什么要按结束时间排序呢?这个问题留到后面解释。其次...
分类:
编程语言 时间:
2015-05-04 23:33:04
阅读次数:
164
考研就是我的全部!然而事情却多得不行~~~
5月,将会是最后一个忙碌的月份!
5.5日,提交挑战杯展品。
5.6日,大创结题答辩。
5.17日,前往西安参加挑战杯决赛,一直持续到5.21日。
5.26日前往北京参加蓝桥杯团队赛决赛。
5.29日前往北京参加蓝桥杯个人赛决赛。
5.30日之前提交深圳杯数学建模论文。
5.30日之前完成中软杯成品。
(5月必须准备好6月第3个周末的英...
分类:
其他好文 时间:
2015-04-30 21:51:00
阅读次数:
185
这种问题以及方法很常见。主要是思路要开阔,讲已知的问题抽象成数学模型或者函数表达式,这正是数学建模的真谛,problem solving(解决实际问题的能力)。法一:利用计数排序,用数组记下每个ID出现的次数,然后找出出现一次的那个ID,时空复杂度都是O(N)。现在如果数据量很大,那么这样的空间复杂度是无法被容忍的法二:利用两个相同的数异或结果为0,将所有的ID都异或一遍,显然最后剩下的值,即为出现...
分类:
其他好文 时间:
2015-04-29 17:12:47
阅读次数:
143