码迷,mamicode.com
首页 > 其他好文 > 详细

机器学习------精心总结

时间:2016-04-23 11:53:53      阅读:699      评论:0      收藏:0      [点我收藏+]

标签:

1.数学

  1. 偏差与方差
  2. 拉格朗日
  3. 核函数
  4. 凸优化
  5. 协方差矩阵
  6. Hessian矩阵
  7. CDF(累计分布函数)
  8. 高斯概率密度函数
  9. 中心极限定理

2.机器学习

Java 机器学习 工具 & 库


1.处理小数据效果好
2.深度学习—大数据,超过500w;图像,语言方面效果奇好


  • SVD

  • 最小二乘法

  • 梯度下降法
  • 局部加权回归

    1.最大似然估计
    2.logistic回归
    3.感知器的初步—logistic的简化情节

  • 牛顿法

    1.介绍了牛顿方法
    2.广义线性模型
    3.多项式分布,softmax回归

  • 高斯判别分析

    1.高斯判别
    2.朴素贝叶斯

  • EM

  • 隐马尔可夫模型
  • 决策树向量机

决策树算法介绍及应用

  • K近邻
  • 支持向量机
  • PageRank
  • 强化学习
  • LDA
  • PCA
  • pLSA
  • LSI
  • ICA
  • 最大熵模型
  • 条件随机场
  • 最大熵隐马尔可夫模型
  • Gradient Boosting
  • K-Means
  • 贝叶斯逻辑斯蒂克回归
  • 关联规则挖掘
  • 随机森林

3.信息论

  1. 压缩率很高的数据结构
  2. 信息熵与信息增益
  3. 数据压缩原理
  4. 香农游戏
  5. 二维码原理

4.深度学习

机器学习的一个分支
各种编程语言的深度学习库整理
深度学习如何入门(知乎)
Elephas:Apache Spark上的Keras深度学习框架


  1. 感知器
  2. 反向传播算法
  3. 自动编码器
  4. 栈式自编码器
  5. 微调多层自编码算法
  6. 深度信息网络
  7. softmax回归
  8. 白化
  9. 池化
  10. 受限玻尔兹曼机
  11. 稀疏编码
  12. 递归神经网络
  13. 卷积神经网络—图像识别,语音识别,,.
  14. 前馈神经网络

5.全文检索

  1. 搜索建索引过程
  2. 搜索评分过程
  3. 搜索查询分析器
  4. Rocchio相关反馈算法
  5. 向量空间模型
  6. BM25基于概率的搜索评分
  7. Lucene源码分析
  8. solrcloud
  9. Solr空间搜索原理
  10. GeoHash算法
  11. 地理空间距离计算原理
  12. WAND检索算法
  13. 智能化信息检索模型
  14. Kullback-Leibler距离/相关熵
  15. 交叉熵

6.计算广告

  1. 正文广告
  2. 上下文广告
  3. 显示广告
  4. 合约广告
  5. 竞价广告
  6. 搜索广告
  7. 受众定向
  8. 竞价广告的定价机制
  9. eCPM估计
  10. 广义第二高价
  11. 精准人群定向
  12. 实时竞价
  13. 广告交易平台
  14. 需求方平台(DSP)程序购买
  15. 广告有效性原理
  16. 二部图匹配算法
  17. HWM算法
  18. 点击流挖掘
  19. 广告系统的一些商业模式
  20. 实时反作弊
  21. CTR点击预测
  22. 架构

7.自然语言处理



  1. N-gram语言模型
  2. 词共现/TFIDF
  3. 噪声信道模型
  4. 统计分类模型
  5. 语义相关性
  6. 基于HMM的词性标注
  7. 统计语言模型的评价方法
  8. 扩充转移网络
  9. 动态规划算法
  10. 最小编辑距离
  11. 浅层句法分析技术
  12. 知识库的构建
  13. 命名实体识别
  14. 未登陆词识别
  15. 语言模型结构设计
  16. 树邻近语法
  17. 文本建模
  18. 随机上下文无关文法
  19. 概率上下文文法
  20. 同义词自动构建(词共现,基于浅层语法分析)
  21. 文本分类技术

8.架构

  1. OOP
  2. 聊天系统/实时高效信息系统架构与源码
  3. Bloom Filter 过滤器
  4. 分布式时钟(逻辑时钟) 同步技术
  5. SCALA
  6. Netty
  7. Jetty
  8. 一致性Hash
  9. 分布式基本组建
  10. 原子广播

9.爬虫

  1. 爬虫原理
  2. 分布式架构
  3. 通用爬虫
  4. 主题爬虫
  5. Nutch
  6. Xpath
  7. 网页去重
  8. URL去重

10.应用

  1. 人脸识别
  2. 垃圾邮件分类
  3. 文本聚类
  4. 语音合成(分解)
  5. 语音识别
  6. 手写识别
  7. 推荐系统
  8. 文档主题分析
  9. 二进制权限系统
  10. 搜索引擎关键字智能提示
  11. 最小敏感局部hash算法
  12. Simrank
  13. 手写输入法
  14. 为文本生成关键词和摘要
  15. 拼音缩写提取
  16. 汉字转拼音/拼音转汉字
  17. 机器翻译
  18. 自动提取标签
  19. 图片提取标题
  20. 文字生成图像
  21. 问答系统

11.Github中的开源项目

值得mark的11个开源机器学习项目


1.scikit-learn Github:scikit-learn
2.Shogun
Github:shogun
3.Accord Framework/AForge.net
Github:Accord Framework/AForge.net
4.Mahout
5.MLlib
6.H2O
Github:H2O
7.Cloudera Oryx
8.GoLearn
9.Weka
10.CUDA-convnet
11.ConvNetJS
Github:ConvNetJS

12.个人收集网址

13.机器学习需要了解的人物

1.吴恩达

2.中国大牛组


《中国大牛组》资源来源于小木虫
小木虫


14.会议论文收集

15.书籍

1.PRML—Pattern Recognition And Machine Learning
豆瓣

机器学习------精心总结

标签:

原文地址:http://www.cnblogs.com/hellochennan/p/5424162.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!