学习的分类: 根据输出空间Y:分类(二分类、多分类)、回归、结构化(监督学习+输出空间有结构); 根据标签y:监督学习、无监督学习(聚类、密度估计、异常点检测)、半监督学习(标注成本高时)、强化学习; 根据数据喂给方式:批、在线(PLA、强化学习)、主动学习; 根据输入空间X:具体(相关物理意义)、 ...
分类:
其他好文 时间:
2017-10-07 19:38:44
阅读次数:
150
什么是聚类分析?聚类算法有哪几种?请选择一种详细描述其计算原理和步骤。 聚类分析(clusteranalysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。 聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxono ...
分类:
其他好文 时间:
2017-10-03 23:30:23
阅读次数:
262
特征处理 在文本挖掘中做了很大的努力,比如提取关键词、情感分析、word embedding聚类之类都尝试过,但效果都不是很好, 对于文本的特征的建议还是去找出一些除了停用词以外的高频词汇,寻找与这个房屋分类问题的具体联系。 到了头疼的部分了,数据有了,我们得想办法从数据里面拿到有区分度的特征。 比 ...
分类:
其他好文 时间:
2017-10-02 09:31:33
阅读次数:
160
Web挖掘 Web挖掘的目标是从Web的超链接、网页内容和使用日志中探寻有用的信息。依据Web挖掘任务,可以划分为三种主要类型:Web结构挖掘、Web内容挖掘和Web使用挖掘。Web结构挖掘简单的说就是从表征Web结构的超链接中找寻有用的知识。例如:从这些链接中可以找到重要的网页,也可以发掘具有共同... ...
分类:
Web程序 时间:
2017-09-30 13:13:35
阅读次数:
313
模式识别作业,虽然没选这课,不过有同学拜托,正好我也想试试这课作业的难度(感觉模式识别是为数不多的不太水而且比较有用的课,没错我就是针对信息论和组合数学233) ...
分类:
其他好文 时间:
2017-09-30 11:40:22
阅读次数:
170
根据训练数据是否拥有标记信息,学习任务可大致划分为两大类:“监督学习”和“无监督学习”,分类和回归是前者的代表,聚类是后者的代表。 归纳与演绎--科学推理的两大基本手段。 机器学习的发展历程: 课后习题: 1.1假设数据集有n种属性,第i个属性可能的取值有ti种,加上该属性的泛化取值(*),所以可能 ...
分类:
其他好文 时间:
2017-09-26 16:05:12
阅读次数:
213
GMM参考这篇文章:Link 简单地说,k-means 的结果是每个数据点被 assign 到其中某一个 cluster 了,而 GMM 则给出这些数据点被 assign 到每个 cluster 的概率,又称作 soft assignment 。 通常单个点的概率都很小,许多很小的数字相乘起来在计算 ...
分类:
编程语言 时间:
2017-09-23 15:19:17
阅读次数:
435
索引的概念 在关系型数据库中,索引是对数据库表中一列或多列的值进行排序的一种结构。 SQL SERVER中有索引的类型:按存储结构区分:“聚集索引(又称聚类索引,簇集索引)”,“分聚集索引(非聚类索引,非簇集索引)”按数据唯一性区分:“唯一索引”,“非唯一索引”按键列个数区分:“单列索引”,“多列索 ...
分类:
数据库 时间:
2017-09-23 14:27:37
阅读次数:
157
一、层次聚类 1、层次聚类的原理及分类 1)层次法(Hierarchicalmethods)先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类。不停的合并,直到合成了一个类。其中类与类的距离的计算方法有:最短距离法,最长距离法,中间距离 ...
分类:
其他好文 时间:
2017-09-17 20:10:48
阅读次数:
191
什么是有监督学习?什么是无监督学习? 概念:输入数据有标签则为有监督学习,输入数据无标签就是无监督学习。 在机器学习中,一般聚类算法是无监督学习,分类和回归为有监督学习。 那么首先来看一下什么是学习:高考时的题目我们平时一般是没有见过的,但是为了准备高考,我们高中三年一直在学习,学基础知识,解题方法 ...
分类:
其他好文 时间:
2017-09-17 17:29:27
阅读次数:
130