搜索关键字：10米跳台比赛预测结果，搜索到145个结果！码迷,mamicode.com！

word2vec模型cbow与skip-gram的比较

cbow和skip-gram都是在word2vec中用于将文本进行向量表示的实现方法，具体的算法实现细节可以去看word2vec的原理介绍文章。我们这里大体讲下两者的区别，尤其注意在使用当中的不同特点。在cbow方法中，是用周围词预测中心词，从而利用中心词的预测结果情况，使用GradientDes ...

分类：其他好文时间：2018-08-03 14:17:19 阅读次数：351

python单分类预测模版，输出支持度，多种分类器，str的csv转float

预测结果为1到11中的1个首先加载数据，训练数据，训练标签，预测数据，预测标签：其中训练数据，预测数据是csv文件格式，而且是str，要转为float并一排排放入lis，然后将所有lis放入traindata或testdata中，但csv中是以","隔开的，所以要将"\t"等都转为","，需要利 ...

分类：编程语言时间：2018-07-31 13:28:12 阅读次数：189

[机器学习python实践(5)]Sklearn实现集成

1,集成集成（Ensemble）分类模型是综合考量多个分类器的预测结果，从而做出决策。一般分为两种方式：1）利用相同的训练数据同时搭建多个独立的分类模型，然后通过投票的方式，以少数服从多数的原则做出最终的分类决策。如随即森林分类器的思想是在相同的训练数据上同时搭建多棵决策树。随机森林分类器在构建每 ...

分类：编程语言时间：2018-07-18 18:06:19 阅读次数：187

做统计特征需要注意的事项

1、要清楚的知道如果有两个样本他们的特征相似，是否就真的代表他们在现实世界中对预测结果的影响是相似的，否则这个就不是特征。2、要避免陷入自己计算自己的怪圈，会导致过拟合。3、采用一个样本的统计特征会比这个样本的本身的特征来预测效果要好。4、要相信人类才是这个世界的最高智慧，建立模型的时候合理思考究竟是什么对预测的结果会有影响，这些影响是怎么组织起来的，这些思考是建立模型的关键。5、合理的计算方式来

分类：其他好文时间：2018-07-16 17:22:00 阅读次数：128

查看neighbors大小对K近邻分类算法预测准确度和泛化能力的影响

代码：结果：总结：在仅考虑单一近邻时，训练集上的预测结果十分完美（接近100%）。但随着邻居个数的增多，模型变得更简单（泛化能力越好），训练集精度也随之下降。为求得较好的预测精度和泛化能力，最佳性能在neighbors为6左右！ ...

分类：编程语言时间：2018-07-12 13:08:06 阅读次数：104

机器学习二分类模型评价指标:准确率\召回率\特异度等

混淆矩阵是一种用于性能评估的方便工具，它是一个方阵，里面的列和行存放的是样本的实际类vs预测类的数量。 P =阳性，N =阴性：指的是预测结果。 T=真，F=假：表示实际结果与预测结果是否一致，一致为真，不一致为假。 TP=真阳性：预测结果为P，且实际与预测一致。 FP=假阳性：预测结果为P，但与 ...

分类：其他好文时间：2018-07-07 15:47:30 阅读次数：223

集成算法

概念：各种模型融合，结果取平均值或投票等项目经验：输出每个模型预测结果的情况，剔除预测效果差的模型（例如预测正样本比率是否符合原数据集正样本比率）Stacking（堆叠）模型：第一阶段最好交叉验证优点：使模型的边界更加平稳，效果更好，过拟合风险更低缺点：消耗时间大，不适合实时处理，只适合离线操作转 ...

分类：编程语言时间：2018-07-02 14:16:23 阅读次数：170

机器学习中常见的损失函数

损失函数是机器学习中常用于优化模型的目标函数，无论是在分类问题，还是回归问题，都是通过损失函数最小化来求得我们的学习模型的。损失函数分为经验风险损失函数和结构风险损失函数。经验风险损失函数是指预测结果和实际结果的差别，结构风险损失函数是指经验风险损失函数加上正则项。通常表示为： θ*是我们通过损失函 ...

分类：其他好文时间：2018-07-01 20:59:46 阅读次数：244

非平衡数据的处理方法

更多风控建模、大数据分析等内容请关注公众号《大数据风控的一点一滴》在分类问题中常常遇到一个比较头疼的问题，即目标变量的类别存在较大偏差的非平衡问题。这样会导致预测结果偏向多类别，因为多类别在损失函数中所占权重更大，偏向多类别可以使损失函数更小。处理非平衡问题一般有两种方法，欠抽样和过抽样。欠抽样 ...

分类：其他好文时间：2018-07-01 20:25:55 阅读次数：184

非平衡数据的处理方法

**更多风控建模、大数据分析等内容请关注公众号《大数据风控的一点一滴》在分类问题中常常遇到一个比较头疼的问题，即目标变量的类别存在较大偏差的非平衡问题。这样会导致预测结果偏向多类别，因为多类别在损失函数中所占权重更大，偏向多类别可以使损失函数更小。处理非平衡问题一般有两种方法，欠抽样和过抽样。欠抽样方法可以生成更简洁的平衡数据集，并减少了学习成本。但是它也带来了一些问题，它会删掉一些有用的样本，尤

分类：其他好文时间：2018-07-01 20:24:39 阅读次数：165

共145条上一页 1 ... 5 6 7 8 9 ... 15 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)