选择并训练模型 至此,我们已明确了问题,并对数据进行了预处理。现在我们选择并训练一个机器学习模型。 在训练集上训练模型 这个过程相对来说较为简单,我们首先训练一个线性回归模型: from sklearn.linear_model import LinearRegression lin_reg = L ...
分类:
其他好文 时间:
2020-02-15 15:04:10
阅读次数:
135
task0201.文本预处理 代码解读 文本预处理步骤: Vocab字典构建步骤: 部分知识汇总: 课后习题 task0202.语言模型与数据集 课后习题 task0203.循环神经网络基础 课后习题 ...
分类:
其他好文 时间:
2020-02-14 22:39:07
阅读次数:
84
文本预处理 文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤: 1. 读入文本 可以直接利用open读入文本 2. 分词 对每个句子进行分词,也就是将一个句子划分成若干个词(token),转换为一个词的序列 分词的时候很多时候需要一份 ...
分类:
其他好文 时间:
2020-02-14 22:20:24
阅读次数:
95
课程引用自伯禹平台:https://www.boyuai.com/elites/course/cZu18YmweLv10OeV 《动手学深度学习》官方网址:http://zh.gluon.ai/ ——面向中文读者的能运行、可讨论的深度学习教科书。 task2:文本预处理;语言模型;循环神经网络基础 ...
分类:
编程语言 时间:
2020-02-14 20:48:41
阅读次数:
77
题目: 传送门 题意: 定义Nanosoft的 logo 为 四个大小相同的正方形合并成一个大正方形。左上角是红色的,右上角是绿色的,左下角是黄色的,右下角是蓝色的。 例如以下这些都是 以下这些都不是 给你一个n * m的矩阵,这个矩阵由 4 个大写字母 “R” , "G", “Y”, “B” 构成 ...
分类:
其他好文 时间:
2020-02-14 16:46:41
阅读次数:
108
文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤: 读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型 现有的工具可以很好地进行分词,spaCy和NLTK。 使用示例: ...
分类:
编程语言 时间:
2020-02-14 16:22:18
阅读次数:
81
文本预处理 读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型 读入文本 import collections import re def read_time_machine(): with open('/home/kesci/inp ...
分类:
其他好文 时间:
2020-02-14 11:01:10
阅读次数:
54
1、图像滤波理论 1.1图像滤波理论 图像滤波即在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制,是图像预处理中不可缺少的操作。消除图像中的噪声又叫做图像滤波或平滑,滤波的目的有两个,一是突出特征以方便处理,二是抑制噪声。 空间域滤波就是在图像平面上对像素进行操作。空间域滤波大体分为两类:平滑 ...
分类:
其他好文 时间:
2020-02-14 00:58:59
阅读次数:
115
「JSOI2015」最小表示 "传送门" 很显然的一个结论:一条边 $u \to v$ 能够被删去,当且仅当至少存在一条其它的路径从 $u$ 通向 $v$ 。 所以我们就建出正反两张图,对每个点开两个 维护它与其他点的连通性,这个可以通过拓扑排序预处理。 然后就枚举每一条边,拿两个端点的两个 与一下 ...
分类:
Web程序 时间:
2020-02-13 09:36:00
阅读次数:
71