码迷,mamicode.com
首页 > 其他好文 > 详细

数据分析大赛考纲:(一)数据分析通识应知

时间:2020-06-23 00:44:39      阅读:136      评论:0      收藏:0      [点我收藏+]

标签:置信区间   差分   数据类型   分类算法   语法   相关性   模型   数据库基础   分析   

1.1. 数据科学基础

1.1.1. 概率基础

1. 概率的定义概率的完备定义;古典概率;基于频率的概率估计;基于专家推测的概率估计
  1. 随机变量及其特征度量随机变量定义;随机变量数学期望;随机变量方差与标准差;期望-方差决策理论;相关性;独立性;
  2. 常用离散随机变量分布贝努利分布;二项分布;泊松分布
  3. 常用连续随机变量分布正态分布;对数正态分布;指数分布
  4. 大数定律与中心极限定理

1.1.2. 数理统计基础

1. 抽样分布理论总体;样本;概率抽样;简单随机抽样;抽样分布理论
2. 总体特征的估计问题
3. 总体比例估计总体比例;样本比例;种群估计;样本容量;抽样误差;
4. 总体均值估计总体均值;样本均值;标准误;置信区间;小样本;t分布
5. 总体特征的假设检验问题
6. 假设检验的基本思想原假设;备择假设;小概率思维;反证法思维;第一类错误(拒真);第二类错误(存伪);检验法则;显著性水平;检验P值
7. 单总体假设检验单边检验;双边检验;二项检验;t-检验
8. 多总体假设检验方差齐性检验;方差分析;多重比较

 

1.2. 人工智能导论及大数据基础

1.2.1. 人工智能的基本概念

目标:学员要能知道人工智能、机器学习和深度学习之间的关系,进一步说,机器学习是人工智能的分支,深度学习又是机器学习的分支。

1.2.2. 机器学习的基本概念

目标:学员能明白和分辨以下概念,并能灵活识别应用场景。

1. 什么是机器学习
2. 监督学习
3. 非监督学习
4. 回归算法
5. 分类算法
6. 聚类算法
7. 聚类模型、回归模型、分类模型的比较

1.2.3. 机器学习理论基础

目标:学员能识别以下机器学习的术语。

1. 损失函数
2. 损失收敛
3. K-Means算法
4. kNN算法

1.2.4. 大数据基础知识

目标:学员要知道并明白数字化的重要性,能理解无论是图片、文字还是语音都要转化成数字化的数据,才有可能被人工智能使用。学员们还要进一步明白最近几年的机器学习的快速发展是和大数据分不开的。

1. 知识点:世界数字化
5. 知识点:大数据和人工智能
6. 知识点:人工智能如何认数字
7. 图像数字化
8. 文字数字化
9. 语音数字化
10. 数据集

1.2.5. 深度学习

1. 神经网络
11. 卷积神经网络CNN
12. 反向传播算法
13. 视觉神经网络
14. 词向量
15. 强化学习

 

1.3. 数据库基础

1. 掌握sql的常用语法结构
16. 掌握数据库表的使用方法
17. 掌握数据库视图的使用方法
18. 掌握数据库的基本数据类型
19. 掌握子查询的创建方法

数据分析大赛考纲:(一)数据分析通识应知

标签:置信区间   差分   数据类型   分类算法   语法   相关性   模型   数据库基础   分析   

原文地址:https://www.cnblogs.com/jackyhdf/p/13179736.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!