一、选题与意义 1.Hadoop平台应用 选题:Hadoop平台应用。 简要说明理由与意义。 可以让我们熟悉Linux系统、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用; 了解大数据处理的基本流程; 熟悉数据预处理方法; 熟悉在不同类型数据库 ...
分类:
其他好文 时间:
2020-06-23 19:18:44
阅读次数:
72
一、sklearn数据集变换 数据预处理、特征抽取、 特征变换、 维数约简 二、Pipeline和FeatureUnion 三、特征抽取之字典向量化和哈希变换 特征抽取: Feature Extraction Loading Feature From Dicts Features hashing T ...
分类:
其他好文 时间:
2020-06-22 01:12:12
阅读次数:
72
SmartbiMining通过深度数据建模,为企业提供预测能力支持文本分析、五大类算法和数据预处理,并为用户提供一站式的流程式建模、拖拽式操作和可视化配置体验。SmartbiMining算法丰富,而且可扩展SmartbiMining数据挖掘平台支持多种高效实用的机器学习算法,包含了分类、回归、聚类、预测、关联,5大类机器学习的成熟算法。其中包含了多种可训练的模型:逻辑回归、决策树、随机森林、朴素贝
分类:
其他好文 时间:
2020-06-19 16:04:38
阅读次数:
182
基本工具介绍 一、环境配置 安装miniconda3作为python环境。 如果配置了CUDA,可以安装tensorflow-gpu。 二、第三方库 数据预处理 Numpy 提供高效的N维数组和向量计算 Scipy 依赖Numpy,提供高效数值计算,包含函数最优、数值积分等任务模块 pandas 数 ...
分类:
其他好文 时间:
2020-06-18 01:24:54
阅读次数:
74
1.torchtext的一些API torchtext.data.Example : 用来表示一个样本,数据+标签torchtext.vocab.Vocab: 词汇表相关torchtext.data.Datasets: 数据集类,__getitem__ 返回 Example实例torchtext.d ...
分类:
其他好文 时间:
2020-06-16 20:12:25
阅读次数:
53
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 21:00:02
阅读次数:
64
1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, ...
分类:
其他好文 时间:
2020-06-14 20:45:45
阅读次数:
70
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 20:38:09
阅读次数:
60
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 20:37:29
阅读次数:
51
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-14 16:59:47
阅读次数:
52