标签:什么是对象 算法 src ase 聚类 sig str 调整 清单
数据科学职位的典型面试过程会有很多轮,其中通常会涉及理论概念,目的是确定应聘者是否了解机器学习的基础知识。
在这篇文章中,我想总结一下我所有的面试经历(面试or被面试)并提出了160多个数据科学理论问题的清单。
其中包括以下主题:
这篇文章中的问题数量似乎远远不够,请记住,面试流程是根据公司的需求和你的工作经历而定的。因此,如果你的工作中没有用过时间序列模型或计算机视觉模型,就不会收到类似的问题。提示:如果不知道某些面试问题的答案,不要灰心。为了简化起见,我根据难度将问题分为三类:
开始吧!
什么是有监督学习???
什么是MSE和RMSE???
如何在K折交叉验证中选择K?你最喜欢的K是什么???
为什么需要one-hot编码????
什么时候需要对线性模型进行特征归一化?什么情况下可以不做归一化????
可以使用L2正则化进行特征选择吗????
如何知道哪些特征对决策树模型更重要????
数据中存在相关特征时会怎样????
如何在梯度提升模型中选择树的数量????
网格搜索参数调整策略和随机搜索有什么区别?什么时候使用一个或另一个????
什么是1.1Dropout?为什么有用?它是如何工作的????
讲一下你是如何进行模型训练的????
什么是对象分割?你知道有哪些框架吗???
如何使用CNN进行文本分类???
何时选择K-means,何时选择DBScan????
什么是奇异值分解?它通常如何用于机器学习????
如何在线评估新的排序算法????
解决冷启动问题的可能方法???
使用树来解决时间序列问题有什么问题????
以上!希望它对各位有用,祝面试愉快!
原文:https://hackernoon.com/160-data-science-interview-questions-415s3y2a
Alexey Grigorev(Lead Data Scientist at OLX Group)
翻译:tjxj666
标签:什么是对象 算法 src ase 聚类 sig str 调整 清单
原文地址:https://www.cnblogs.com/jpld/p/12424953.html