利用TfidfVectorizer进行中文文本分类(数据集是复旦中文语料) 利用RNN进行中文文本分类(数据集是复旦中文语料) 上一节我们利用了RNN(GRU)对中文文本进行了分类,本节我们将继续使用CNN对中文文本进行分类。 数据处理还是没有变,只是换了个模型,代码如下: # coding: ut ...
分类:
其他好文 时间:
2020-10-19 23:06:35
阅读次数:
58
MVC(ModelViewController)即模型、视图、控制器 模型表示业务数据及业务处理,用来封装数据及行为;视图是用户看到并与之交互的界面;控制器接受用户输入并调用模型和视图去完成用户的请求。 aspx 就是 View,视图; Model:DataSet、Reader、对象; Contro ...
分类:
Web程序 时间:
2020-10-09 20:25:18
阅读次数:
32
通常的认识是:Flink 流模式跑流任务,批模式跑批任务,用流模式跑离线任务也是个有意思的事情 虽然新版 Flink 已经在 sql 上实现了一定程度的流批一体,但是 DataStream 和 DataSet API 还是相差比较大的 用 Flink 跑离线任务也是机缘巧合(也是必然,毕竟我不会 S ...
分类:
其他好文 时间:
2020-09-24 21:32:07
阅读次数:
46
##layout files If a frame defined in a layout file requires an attached dataset, the data files necessary to build the dataset are referenced in the l ...
分类:
其他好文 时间:
2020-09-18 02:09:57
阅读次数:
40
一、Dataset 对单个样本的处理 1、__getitem__: 返回一条数据或一个样本,obj[index] == obj.__getitem__() 2、__len__: 返回整个数据集中样本的数量,len(obj) == obj.__len__() 二、DataLoader 对batch个样 ...
分类:
其他好文 时间:
2020-09-17 23:20:15
阅读次数:
32
论文:VoxCeleb: a large-scale speaker identification dataset 思想:1)整理了一个非约束的声纹识别数据集,1251个左右说话人,每个说话人100utts;整理来源youtube; 2)采用VGG-M网络进行说话人辨别和验证特征表达学习,并在此基础 ...
分类:
其他好文 时间:
2020-09-17 23:09:25
阅读次数:
57
KITTI数据集是自动驾驶领域的经典数据集之一,raw data大小有上百G,官方在raw data界面提供了一个shell脚本raw dataset download script来帮助下载,该shell脚本会自动下载所有raw data并解压到指定文件夹。 由于raw data过大,断断续续下了 ...
分类:
编程语言 时间:
2020-09-17 20:48:36
阅读次数:
75
百度了快一天,没结果,除了几个原创的,都是复制粘贴的内容。 不想用别的笨办法,于是脑洞大开,想出了我的办法。 首先是前台代码,与网上的比较类似: xmlns:jz="clr-namespace:*****.Model;assembly=****" xmlns:utils="clr-namespace ...
分类:
编程语言 时间:
2020-09-17 17:26:10
阅读次数:
39
public static DataTable GetExcelToDataTableBySheet(string FileFullPath, string SheetName="") { //SheetName = "Sheet1$"; //HDR=Yes, 表示第一行为列名第二行才是数据 / H ...
问题描述: TensorFlow中dataset方法中 dataset = dataset.shuffle(buffer_size=20).repeat().batch(batch_size) 其中shuffle的buffer_size是有什么用? 答: 是做随机采样使用的缓冲大小,buffer_s ...
分类:
其他好文 时间:
2020-09-11 16:12:19
阅读次数:
77