1、查看数据类型: type(数据)(在下面的探究中会标注出来) 2、初步探究(重点是机器学习模型只能处理数值数据,所以新闻样本集里的每一个文本样本都要转为TF-IDF向量。) from sklearn.datasets import fetch_20newsgroups from sklearn. ...
分类:
其他好文 时间:
2021-05-04 16:34:58
阅读次数:
0
Numpy实现K折交叉验证的数据划分 本实例使用Numpy的数组切片语法,实现了K折交叉验证的数据划分 背景:K折交叉验证 为什么需要这个?在机器学习中,因为如下原因,使用K折交叉验证能更好评估模型效果: 样本量不充足,划分了训练集和测试集后,训练数据更少; 训练集和测试集的不同划分,可能会导致不同 ...
分类:
其他好文 时间:
2021-05-04 15:39:17
阅读次数:
0
目标 了解Python Python的应用领域 Python的版本 Python介绍 Python是时下最流行、最火爆的编程语言之一,具体原因如下: 1. 简单、易学,适应人群广泛 2. 免费、开源 3. 应用领域广泛 备注:以下知名框架均是Python语言开发。 Google开源机器学习框架:Te ...
分类:
编程语言 时间:
2021-05-03 12:28:17
阅读次数:
0
100天搞定机器学习:模型训练好了,然后呢? 大家好,我是老胡。 许久没有更新100天搞定机器学习系列了,最近在看一个开源框架,其中有用到 gRPC ,它可以用于机器学习模型的部署,也可用于深度学习框架的开发,本文就当是《100天搞定机器学习》的番外篇吧。 gRPC(Remote Procedure ...
分类:
其他好文 时间:
2021-04-20 15:42:22
阅读次数:
0
但是机器学习模型本质上是相关性的学习,大量弱特征的引入在提升模型效果的同时,就会削弱可解释性。 滴滴治理算法探索与实践 原创 网约车技术团队 滴滴技术 2021-04-16 https://mp.weixin.qq.com/s/Kn0NToHvCPvIBvSIIN18cQ ...
分类:
其他好文 时间:
2021-04-20 15:19:17
阅读次数:
0
用到:java.time,java.util两个jar包,系统默认的包 @Test public void ddd(){ LocalDateTime inDate = convertDateToLDT(DateUtils.strToDate("2021-04-13 17:45", DateUtils ...
分类:
编程语言 时间:
2021-04-15 12:50:08
阅读次数:
0
通常,我们使用bert做文本分类,泛化性好、表现优秀。在进行文本相似性计算任务时,往往是对语料训练词向量,再聚合文本向量embedding数据,计算相似度;但是,word2vec是静态词向量,表征能力有限,此时,可以用已进行特定环境下训练的bert模型,抽取出cls向量作为整个句子的表征向量以供下游 ...
分类:
其他好文 时间:
2021-04-15 12:20:10
阅读次数:
0
service mysql start 启动MySQL 1、出现报错The server quit without updating PID file... 1.1.可能是/usr/local/mysql/data/rekfan.pid文件没有写的权限 #执行: chown -R mysql:mys ...
分类:
数据库 时间:
2021-04-12 12:16:04
阅读次数:
0
mAP https://jonathan-hui.medium.com/map-mean-average-precision-for-object-detection-45c121a31173 SVM https://towardsdatascience.com/https-medium-com-p ...
分类:
其他好文 时间:
2021-04-08 14:01:18
阅读次数:
0
利用Pytorch搭建神经网络 在完成李宏毅2020机器学习图像分类(hw3)时,需要具备会使用pytorch的能力,通过pytorch的官方教程进行学习https://pytorch123.com/ 训练神经网络的步骤如下: 1.定义神经网络(普通CNN为例) 这里的size = x.size() ...
分类:
其他好文 时间:
2021-03-31 12:17:16
阅读次数:
0