Training an algorithm involes four ingredients: Data Model Objective function: We put data input a Model and get output out of it. The value we call i ...
分类:
Web程序 时间:
2020-02-18 09:58:23
阅读次数:
80
编码器—解码器(seq2seq) 在自然语言处理的很多应用中,输入和输出都可以是不定长序列。以机器翻译为例,输入可以是一段不定长的英语文本序列,输出可以是一段不定长的法语文本序列,例如 英语输入:“They”、“are”、“watching”、“.” 法语输出:“Ils”、“regardent”、“ ...
分类:
其他好文 时间:
2020-02-17 12:08:41
阅读次数:
228
正向传播 正向传播的计算图 通常绘制计算图来可视化运算符和变量在计算中的依赖关系。下图绘制了本节中样例模型正向传播的计算图,其中左下角是输入,右上角是输出。可以看到,图中箭头方向大多是向右和向上,其中方框代表变量,圆圈代表运算符,箭头表示从输入到输出之间的依赖关系。 反向传播 训练深度学习模型 在训 ...
分类:
其他好文 时间:
2020-02-15 15:34:33
阅读次数:
79
训练误差和泛化误差 需要区分训练误差(training error)和泛化误差(generalization error)。前者指模型在训练数据集上表现出的误差,后者指模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。计算训练误差和泛化误差可以使用之前介绍过的损失函 ...
分类:
其他好文 时间:
2020-02-15 13:40:33
阅读次数:
65
循环神经网络 下图展示了如何基于循环神经网络实现语言模型。目的是基于当前的输入与过去的输入序列,预测序列的下一个字符。循环神经网络引入一个隐藏变量𝐻,用𝐻𝑡表示𝐻在时间步𝑡的值。𝐻𝑡的计算基于𝑋𝑡和𝐻𝑡?1,可以认为𝐻𝑡记录了到当前字符为止的序列信息,利用𝐻𝑡对序列的下 ...
分类:
其他好文 时间:
2020-02-14 18:28:44
阅读次数:
101
文本预处理 读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型 读入文本 import collections import re def read_time_machine(): with open('/home/kesci/inp ...
分类:
其他好文 时间:
2020-02-14 11:01:10
阅读次数:
54
语言模型 一段自然语言文本可以看作是一个离散时间序列,给定一个长度为𝑇的词的序列𝑤1,𝑤2,…,𝑤𝑇,语言模型的目标就是评估该序列是否合理,即计算该序列的概率: 本节我们介绍基于统计的语言模型,主要是𝑛元语法(𝑛-gram)。 语言模型 假设序列𝑤1,𝑤2,…,𝑤𝑇中的每个词是 ...
分类:
编程语言 时间:
2020-02-14 10:30:47
阅读次数:
106
https://www.cnblogs.com/bonelee/p/8535045.html https://pypi.org/project/imbalanced-learn/ https://imbalanced-learn.org/stable/over_sampling.html ...
分类:
其他好文 时间:
2020-02-13 16:35:18
阅读次数:
48
一、线性回归 1、模型 2、损失函数 3、优化函数-梯度下降 #!/usr/bin/env python # coding: utf-8 import torch import time # init variable a, b as 1000 dimension vector n = 1000 a ...
分类:
其他好文 时间:
2020-02-12 10:53:33
阅读次数:
110
今天主要学习了实验 7 Spark 机器学习库 MLlib 编程实践, 主要代码: import org.apache.spark.ml.feature.PCA import org.apache.spark.sql.Row import org.apache.spark.ml.linalg.{Ve ...
分类:
其他好文 时间:
2020-02-10 16:34:34
阅读次数:
132