摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理。首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集。诚然在传统学科中,其在以上学科发挥作用很大。然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要。本系列统计学的学习基于《深入浅出统计学》一书(偏向...
分类:
其他好文 时间:
2015-10-26 00:11:53
阅读次数:
345
在文本相似度判定中,作者将该算法用于文本聚类中,其核心思想通过比较两个文本向量中元素的相似度,即向量中所含的元素相似个数越多,则两个向量越相似,继而上述文本越相似。作者在短文本相似判定中采用了余弦相似度该算法来实现,本文借鉴数学集合取交集,借用现有组件来实现上述算法功能,继而减少工作量,也具备便捷性...
分类:
其他好文 时间:
2015-10-25 12:03:30
阅读次数:
292
摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理。首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集。诚然在传统学科中,其在以上学科发挥作用很大。然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要。本系列统计学的学习基于《深入浅出统计学》一书(偏向...
分类:
其他好文 时间:
2015-10-23 22:42:58
阅读次数:
501
摘要:程序员眼中的统计学系列是作者和团队共同学习笔记的整理。首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集。诚然在传统学科中,其在以上学科发挥作用很大。然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要。本系列统计学的学习基于《深入浅出统计学》一书(偏向...
分类:
其他好文 时间:
2015-10-22 23:56:56
阅读次数:
863
计算描述:计算规则指的是和其它“参与者类型成员”的之间的计算,必须求解处理人不为空的情况下才进行规则计算,各个“参与者类型成员”按序号顺序执行。
计算算法:并集(权重最低),交集(权重中),互拆(权重最高,且是独占式)
规则要点:
按序号顺序执行计算结果
参与者处理人不为空才参与...
分类:
其他好文 时间:
2015-10-17 16:11:30
阅读次数:
158
有时候,为了需求,需要统计两个 list 之间的交集,并集,差集。查询了一些资料,现在总结在下面:1. 获取两个list 的交集#方法一:a=[2,3,4,5]b=[2,5,8]tmp=[valforvalinaifvalinb]printtmp#[2,5]#方法二printlist(set(a)....
分类:
编程语言 时间:
2015-10-16 17:04:57
阅读次数:
140
简介:程序员眼中的统计学系列是作者和团队共同学习笔记的整理。首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集。诚然在传统学科中,其在以上学科发挥作用很大。然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要。本系列统计学的学习基于《深入浅出统计学》一书(偏向...
分类:
编程语言 时间:
2015-10-15 20:21:11
阅读次数:
310
简介:程序员眼中的统计学系列是作者和团队共同学习笔记的整理。首先提到统计学,很多人认为是经济学或者数学的专利,与计算机并没有交集。诚然在传统学科中,其在以上学科发挥作用很大。然而随着科学技术的发展和机器智能的普及,统计学在机器智能中的作用越来越重要。本系列统计学的学习基于《深入浅出统计学》一书(偏向...
分类:
其他好文 时间:
2015-10-14 21:37:42
阅读次数:
333
*collection是所有集合的父类接口,具有增{add(),addAll(),},删{remove (),removeAll(),clear()},查{contains(),containsAll(),isEmpty(),size()},取交集retainAll(),遍历iterator(),哈...
分类:
其他好文 时间:
2015-10-10 16:55:47
阅读次数:
125
在Python中集合set是基本数据类型的一种,它有可变集合(set)和不可变集合(frozenset)两种。创建集合set、集合set添加、集合删除、交集、并集、差集的操作都是非常实用的方法。 1.创建集合 set类是在python的sets模块中,大家现在使用的python2.3中,不需要导入s...
分类:
编程语言 时间:
2015-10-07 10:48:06
阅读次数:
319