自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。简单点说就是怎样让计算机能够理解人类的语言,以执行如机器翻译、文本分析、情感分析等任务。 自然语言处理是人工智能领域比较火热的方向,本人决定入坑是因为听那个谁说,这个方向对数 ...
分类:
编程语言 时间:
2020-04-20 21:20:49
阅读次数:
98
学习资料:《统计学习方法 第二版》、《机器学习实战》、吴恩达机器学习课程 一. 感知机Proceptron 1. 感知机是根据输入实例的特征向量$x$对其进行二类分类的线性分类模型:$f(x)=\operatorname{sign}(w \cdot x+b)$,感知机模型对应于输入空间(特征空间)中 ...
分类:
其他好文 时间:
2020-04-10 19:43:53
阅读次数:
140
内容简介 机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。 《机器学习实战》主要介绍机器学习基础,以及如何利用算法进行分类,并逐 ...
分类:
系统相关 时间:
2020-03-19 21:22:10
阅读次数:
77
机器学习实战之K-近邻算法: KNN算法,就是在已知数据集中,计算出离输入的需要预测的点最接近的K个点,然后通过这最近的K个点中哪种分类所占比最高,该预测点就是哪一种分类。 from numpy import * import operator import matplotlib import ma ...
分类:
编程语言 时间:
2020-02-19 18:49:49
阅读次数:
66
经常有初学者 问我,自己想往大数据方向发展,该学哪些技术,学习路线是什么样的,觉得大数据很火,就业很好,薪资很高。如果自己很迷茫,为了这些原因想往大数据方向发展,也可以,那么我就想问一下,你的专业是什么,对于计算机/软件,你的兴趣是什么?是计算机专业,对操作系统、硬件、网络、服务器感兴趣?是软件专业 ...
分类:
其他好文 时间:
2020-02-06 16:18:55
阅读次数:
85
同在自学cs229。我是看完ng在coursera上的机器学习视频来的。一楼的老兄说的没错,听课之前最好还是先浏览一下材料,然后不懂的地方去结合李航的《统计学习方法》上面找答案。实战的话,《机器学习实战》对初学者很友好。Ng讲完哪个算法,去《统计》上巩固一下,然后找到《实战》上对应的章节用pytho ...
分类:
其他好文 时间:
2019-12-24 15:39:04
阅读次数:
72
本篇随笔是数据科学家学习第六周的内容,主要参考资料为: 1.出场率No.1的逻辑回归算法,是怎样“炼成”的? https://mp.weixin.qq.com/s/xfteESh2bs1PTuO2q39tbQ 2.逻辑回归 https://developers.google.cn/machine-l ...
分类:
其他好文 时间:
2019-12-14 13:58:34
阅读次数:
114
代码来自《机器学习实战》https://github.com/wzy6642/Machine-Learning-in-Action-Python3 K-近邻算法(KNN) 介绍 简单地说,k-近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高、对异常值不敏感,无数据输入假定。 缺点:计 ...
分类:
其他好文 时间:
2019-12-11 23:18:34
阅读次数:
114
标签: 机器学习 1. 贝叶斯公式是机器学习中常用的计算方法,例如,甲射中靶标的概率是0.4,乙射中靶标的概率是0.8,现在有个人中靶了,问问是甲射中的概率。这非常好计算,P=0.4/(0.8+0.4)=0.33,这是贝叶斯公式的基本应用,具体的贝叶斯公式如下: 2. 《机器学习实战》中的贝叶斯实现 ...
分类:
其他好文 时间:
2019-10-27 15:05:13
阅读次数:
116
机器学习 正则化(岭回归、lasso)和前向逐步回归 本文代码均来自于《机器学习实战》 这三种要处理的是同样的问题,也就是数据的特征数量大于样本数量的情况。这个时候会出现矩阵不可逆的情况,为什么呢? 矩阵可逆的条件是:1. 方阵 2. 满秩 X.t\ X必然是方阵(nxmxmxn=nxn,最终行列数 ...
分类:
其他好文 时间:
2019-10-19 14:43:12
阅读次数:
101