spark 提供了两个机器学习库 MLlib 和 ML,MLlib 是 spark 第一个机器学习库,相比于 ML,它更加成熟 rdd 是 spark core 的数据抽象,dataframe 是 sparkSQL 的数据抽象, 而 MLib 的数据抽象包括 Vector、LabeledPoint、 ...
分类:
其他好文 时间:
2019-12-20 18:26:13
阅读次数:
101
01 机器学习介绍 人工智能的发展 1. 人工智能 机器学习 深度学习 机器学习的用途 图像识别 CV 1. 无人驾驶 2. 医疗 识别CT图细微区别 3. 图片艺术化 4. iphone 人脸识别 自然语言处理 NLP 1. 新闻自动生成机器人 传统预测 1. 信贷、销量预测 机器学习库和框架 1 ...
分类:
其他好文 时间:
2019-11-09 15:44:13
阅读次数:
91
机器学习库sklearn 官方documentation(资料)中分为不同的部分: 其中我们主要讲User Guide(机器学习算法理论介绍)、API(程序实现方法): 一、User Guide https://scikit-learn.org/stable/user_guide.html 二、ap ...
分类:
编程语言 时间:
2019-11-03 14:23:33
阅读次数:
111
认识 sklearn 官网地址: https://scikit learn.gor/stable/ 从2007年发布以来, scikit learn已成为重要的Python机器学习库, 简称sklearn, 支持包括 分类, 回归, 降维和聚类 等机器学习算法, 还包括了 特征提取, 数据处理, 模 ...
分类:
其他好文 时间:
2019-10-26 00:53:35
阅读次数:
100
机器学习目标: 以算法、案例为驱动的学习,浅显易懂的数学知识。 目标: 熟悉机器学习各类算法的原理 掌握算法的使用,能够结合场景解决实际问题 掌握机器学习算法库和框架的技能 机器学习主要领域:自然语言处理、图像识别、传统预测。 机器学习库和框架:sklearn。 深度学习框架:tensorflow。 ...
分类:
其他好文 时间:
2019-10-21 11:43:59
阅读次数:
77
一.python使用的模块 1.numpy 数据分析的底层数据结构 2.matplotlib 数据可视化模块 3.pandas 数据分析高级接口模块,在前两个的基础上 4.scipy,sklearn 机器学习库,提供算法 ...
分类:
编程语言 时间:
2019-10-19 20:19:47
阅读次数:
104
1 一元线性回归 import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression #导入机器学习库中的线性回归模块 dat ...
分类:
其他好文 时间:
2019-10-18 00:01:35
阅读次数:
111
分析一套源代码的代码规范和风格并讨论如何改进优化代码 笔者工程实践课题是:基于语音识别的智能聊天机器人设计。本题目需要先研究机器学习的基本方法,用TeansorFlow机器学习库,通过Python构建一个基于LSTM循环神经网络的语音识别器。 故此,笔者将选取Tensorflow源码进行分析,分析其 ...
分类:
其他好文 时间:
2019-10-13 15:35:43
阅读次数:
75
Kaggle数据集:https://www.kaggle.com/datasets 亚马逊数据集:https://registry.opendata.aws/ UCI机器学习库:https://archive.ics.uci.edu/ml/datasets.html 谷歌的数据集搜索引擎:https ...
分类:
其他好文 时间:
2019-10-02 21:10:05
阅读次数:
105
数据挖掘 推荐算法(Mahout工具) 一、简介 Apache顶级项目(2010.4) Hadoop上的开源机器学习库 可伸缩扩展的 Java库 推荐引擎(协同过滤)、聚类和分类 二、机器学习介绍 通常问题都归为这几类问题 分类问题 回归问题 聚类问题 推荐问题 三、安装方法 3.1 下载Mahou ...
分类:
编程语言 时间:
2019-09-07 13:38:47
阅读次数:
141