scala代码: package offline import org.apache.spark.ml.feature.{HashingTF, IDF} import org.apache.spark.ml.linalg.Vectors import org.apache.spark.sql.Spa ...
分类:
其他好文 时间:
2020-04-23 21:27:31
阅读次数:
67
使用python依次读取文件中的所有csv格式的数据: #coding=gbk import pandas as pd import os path = r'D:\ml_datasets\PHM\c6' def get_file(): #创建一个空列表 files =os.listdir(path) ...
分类:
编程语言 时间:
2020-04-23 16:12:50
阅读次数:
216
随机森林,是指用随机的方式建立一个森林,森林里面有许多决策树,且随机森林中的树与树之间是彼此独立的。在得到随机森林后,当有一个新的样本输入的时候,让森林中的每一棵树分别进行计算并进行统计汇总,得分最多的那个结果为最终的结果。随机森林既可以处理属性为离散值的样本(ID3算法),也可以处理属性为连续值的 ...
分类:
其他好文 时间:
2020-04-23 00:41:07
阅读次数:
102
集成学习 集成学习分为bagging和boosting两类,典型的bagging有随机森林等,典型的boosting有gbdt和adaboost等(xgboost和lightGBM都是基于gbdt的高效实现,在我的另外两篇博文中都有介绍)。 bagging与boosting的区别如下所述: 共同点: ...
分类:
其他好文 时间:
2020-04-21 15:17:19
阅读次数:
90
机器学习入门 快速版 本文地址: https://github.com/no7dw/MachineLearningTutorial background 从数据量的角度,Machine Learning (ML) 是解决传统程序在数据量大,条件多的情况下,使用代码处理复杂场景已经力不从心的情况下的一 ...
分类:
其他好文 时间:
2020-04-20 01:17:10
阅读次数:
52
https://codeforces.ml/contest/1337/problem/E 给出两个字符串 s和t ,字符串s的长度大于等于t的长度,和一个空字符串A; 可以执行两种操作: 1.将s的第一个字符删除并加到A字符串的前面; 2.将s的第一个字符删除并加到A字符串的后面; 求此过程中A的前 ...
分类:
其他好文 时间:
2020-04-19 18:01:51
阅读次数:
82
课程目标 掌握python的基本操作 适用人群 适合python初学者 课程简介 深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intell ...
分类:
编程语言 时间:
2020-04-19 17:59:00
阅读次数:
97
原文:谁说.NET不适合搞大数据,机器学习、人工智能 SciSharp Stack SciSharp STACK: https://scisharp.github.io/SciSharp/ 基于.NET的开源生态系统,用于数据科学、机器学习和AI。 SciSharp将所有主要的ML/AI框架从Pyt... ...
分类:
Web程序 时间:
2020-04-19 10:57:34
阅读次数:
64
目录 蒙特卡洛方法概述 采样方法 小结 从名字我们可以看出,MCMC由两个MC组成,即蒙特卡罗方法(Monte Carlo Simulation,简称MC)和马尔科夫链(Markov Chain ,也简称MC)。这个因为受限玻尔兹曼机(RBM)中需要应用,所以先学习下其原理。本文先讲解蒙特卡洛方法。 ...
分类:
其他好文 时间:
2020-04-19 00:37:47
阅读次数:
73
SciSharp Stack SciSharp STACK: "https://scisharp.github.io/SciSharp/" 基于 的开源生态系统,用于数据科学、机器学习和AI。 将所有主要的ML/AI框架从 引入 . 特点 为.NET开发者 开发者使用他们所了解和喜爱的工具可以最高效 ...
分类:
Web程序 时间:
2020-04-18 16:04:31
阅读次数:
95