机器学习”小憩“——总结应用场景 常见的机器学习模型:感知机,线性回归,逻辑回归,支持向量机,决策树,随机森林,GBDT,XGBoost,贝叶斯,KNN,K-means等; 常见的机器学习理论:过拟合问题,交叉验证问题,模型选择问题,模型融合问题等; K近邻:算法采用测量不同特征值之间的距离的方法进 ...
分类:
编程语言 时间:
2019-07-20 13:00:47
阅读次数:
162
机器学习模型的参数和超参数 参数 :模型参数,可以用数据进行估计,是模型内部的配置变量,通常使用优化算法估计模型参数,优化算法是对参数的可能值进行的一种有效搜索。例如人造神经网络中的权重、支持向量机中的支持向量、 线性回归或逻辑回归中的系数 超参数 :必须手动设置,是模型外部的配置变量,模型超参数常 ...
分类:
编程语言 时间:
2019-07-10 22:54:07
阅读次数:
140
前置技能: "tarjan求强连通分量" 缩点 。 顾名思义,就是在图论算法中将一些点缩成一个点的一种算法。 应用 貌似明白了,但是这有什么用呢? 我们经常求最短路,但是如果我们要求最长路呢? 标准问法: 给你一张有向图,每个点都有一个点权(不是边权了哦),且每一个点都可以经过任意多次,但是点权只能 ...
分类:
编程语言 时间:
2019-07-02 21:22:10
阅读次数:
589
一、K均值聚类算法 算法步骤如下: 1、初始化 已知数据集合X,及事先指定聚类的总类数N,在X中随机选取N个对象作为初始的聚类中心。 2、设定迭代终止条件 通常设置最大循环次数或者聚类中心的变化误差。 3、更新样本对象所属类 根据距离准则将数据对象分配到距离最接近的类。 4、更新类的中心位置 将每一 ...
分类:
其他好文 时间:
2019-06-17 14:09:59
阅读次数:
124
一、背景 为什么会学习FP-growth算法?起因是在工作中有两个场景想知道哪些组合比较频繁,分析频繁出现的原因,并以此分类给用户贴上标签或根据频繁组合场景发现是否有必要增改场景。以往一般是直接SQL跑出不同组合的频次分布,但遗憾的是长尾非常多,眼看着某几个组合出现频次很大,但Excel处理就得穷举 ...
分类:
编程语言 时间:
2019-05-16 12:23:12
阅读次数:
149
1. 简单非线性关系数据集测试(XOR): X: Y 0 0 0 0 1 1 1 0 1 1 1 0 # -*- coding:utf-8 -*- from NeuralNetwork import NeuralNetwork import numpy as np nn = NeuralNetwor ...
分类:
编程语言 时间:
2019-02-26 22:24:49
阅读次数:
206
Toping Kagglers:Bestfitting,目前世界排名第一 Kaggle团队 |2018年5月7日 我们在排行榜上排名第一 - 这是两年前令人惊讶地加入该平台的竞争对手。Shubin Dai,他的朋友们更喜欢Kaggle或宾果游戏,他是一位住在中国长沙的数据科学家和工程经理。他目前领导 ...
分类:
其他好文 时间:
2019-02-20 10:02:12
阅读次数:
178
[toc] 题目链接 "Satisfiability of Equality Equations LeetCode" 注意点 必须要初始化pre 解法 解法一:典型的并查集算法应用。先遍历所有等式,将等号两边的字母加入同一分类,每类中的字母都是相等的。然后遍历不等式,如果不等号两边的字母属于同一类则 ...
分类:
其他好文 时间:
2019-02-12 13:23:23
阅读次数:
171
机器学习的方法(算法): 应用:Google now \ google photos 百度图片识别,机器学习视觉处理系统 房价、股价、神经网络:监督学习 ...
分类:
其他好文 时间:
2019-02-09 14:35:11
阅读次数:
159
算法杂货铺——分类算法之朴素贝叶斯分类(Naive Bayesian classification) 0、写在前面的话 我个人一直很喜欢算法一类的东西,在我看来算法是人类智慧的精华,其中蕴含着无与伦比的美感。而每次将学过的算法应用到实际中,并解决了实际问题后,那种快感更是我在其它地方体会不到的。 一 ...
分类:
其他好文 时间:
2019-01-17 15:52:13
阅读次数:
210