跟着Bag of Words Meets Bags of Popcorn的初学者实例,敲了一遍代码。主要用到的是CountVectorizer,生成每个评论的词频向量,然后利用随机森林建立模型,对新的评论进行预测。提交之后,分数大概为0.84。 ...
分类:
编程语言 时间:
2017-10-24 11:34:57
阅读次数:
230
PS:本博文摘抄自中国慕课大学上的课程《Python数据分析与展示》,推荐刚入门的同学去学习,这是非常好的入门视频。 Numpy是科学计算库,是一个强大的N维数组对象ndarray,是广播功能函数。其整合C/C++.fortran代码的工具 ,更是Scipy、Pandas等的基础 .ndim :维度 ...
分类:
编程语言 时间:
2017-10-09 20:59:43
阅读次数:
235
一、一般模型 结果是:0.82222222222222219 二、加入正则项: 结果是:0.77777777777777779 ...
分类:
其他好文 时间:
2017-10-06 13:25:22
阅读次数:
209
自带的 软件包源 不好用,卡顿严重,准备替换它: 方式一:deepin linux 如何更新或者更换软件源(注意:好像不起作用) 方式二:【推荐】利用 阿里云 提供的镜像快速更换本地的 yum 源 (CentOS/Ubuntu/Deepin 等系统都被支持),点击右边的“help”,会告诉你如何替换 ...
分类:
其他好文 时间:
2017-10-06 12:27:54
阅读次数:
8092
这是一个用于分析'图'结构的包,由于我只是用到了浅显的可视化功能,所以这个介绍会对其使用浅尝辄止。 解决matplotlib中文字体缺失问题, 读入数据, 由于图的edge输入格式是(节点1,节点2)的形式,所以我们需要整理一下数据格式, 画图,这里面采取的是为Graph对象添加edge的形式,也可 ...
分类:
Web程序 时间:
2017-09-25 21:59:29
阅读次数:
320
地址:http://codeforces.com/gym/101194 题目:略 思路: 这题做法挺多的,可以sam也可以后缀数组,我用sam做的。 1.我自己yy的思路(瞎bb的) 把第一个串建立sam,然后让其他串在上面跑。 每走到一个位置p,当前长度为num,就代表这个endpos集合里的长度 ...
分类:
其他好文 时间:
2017-09-25 16:05:49
阅读次数:
135
原文:Android零基础入门第62节:搜索框组件SearchView 一、SearchView概述 SearchView是搜索框组件,它可以让用户在文本框内输入文字,并允许通过监听器监控用户输入,当用户输入完成后提交搜索时,也可通过监听器执行实际的搜索。 SearchView默认是展示一个sear... ...
分类:
移动开发 时间:
2017-09-19 14:58:09
阅读次数:
329
Ikki's Story IV - Panda's Trick Time Limit: 1000MS Memory Limit: 131072K Total Submissions: 10448 Accepted: 3829 Description liympanda, one of Ikki’s ...
分类:
其他好文 时间:
2017-09-15 16:42:04
阅读次数:
228
数据为DataFrame格式,如下: 1.对每一行,FirstCab的值为空时,Weight的值乘以0.8 方法一(可行):df.loc[df['FirstCab'].isnull(),'Weight'] *= 0.8 方法二(可行):df['Weight'] = np.where(df['Firs ...
分类:
其他好文 时间:
2017-09-12 00:03:29
阅读次数:
366