机器学习算法与自然语言处理出品@公众号原创专栏作者huybery学校|东北大学关于自监督学习,知乎上已经有了一些资源,比如师兄@bingo的两篇介绍[2][3]、@NaiyanWang大佬之前做的survey[4]、还有最新的@Sherlock[5]。本来我的这篇分享是准备叫「Self-SupervisedLearning入门介绍」,可惜在写作的过程中@Sherlock老哥抢先一步,所以只能叫「再
分类:
其他好文 时间:
2020-11-26 14:38:02
阅读次数:
6
机器学习算法与自然语言处理出品@公众号原创专栏作者Don.hub单位|京东算法工程师学校|帝国理工大学OutlineIntuitionAnalysisProsConsFromSeq2SeqToAttentionModelseq2seq很重要,但是缺陷也很明显attentionwasbornWritetheencoderanddecodermodelTaxonomyofattentionnumber
分类:
其他好文 时间:
2020-11-26 14:37:40
阅读次数:
4
参数参数分为两种:可学习得到的参数,和超参数。机器学习可以归结为学习一个映射函数f:x→y,将输入变量x映射为输出变量y。一般我们可以假设映射函数为y=f(x,θ)。其中θ即为函数的参数。参数可以通过学习算法进行学习。除了可学习的参数之外,还有一类参数是用来定义模型结构或训练策略的,这类参数叫做超参数(Hyper-Parameter)。超参数和可学习的参数不同,通常是按照人的经验设定,或者通过网格
分类:
其他好文 时间:
2020-11-26 14:22:46
阅读次数:
6
机器学习算法与自然语言处理出品@公众号原创专栏作者刘聪NLP学校|中国药科大学药学信息学硕士知乎专栏|自然语言处理相关论文前几天写了一篇短文本相似度算法研究的文章,不过里面介绍的方法基本上都是基于词向量生成句子向量的方法。今天在这里就介绍一下传统算法TF-IDF是如何计算短文本相似度的。TF-IDF是英文TermFrequency–InverseDocumentFrequency的缩写,中文叫做词
分类:
其他好文 时间:
2020-11-25 12:59:04
阅读次数:
10
机器学习算法与自然语言处理出品@公众号原创专栏作者刘聪NLP学校|NLP算法工程师知乎专栏|自然语言处理相关论文短文本相似度,即求解两个短文本之间的相似程度;它是文本匹配任务或文本蕴含任务的一种特殊形式,返回文本之间相似程度的具体数值。然而在工业界中,短文本相似度计算占有举足轻重的地位。例如:在问答系统任务(问答机器人)中,我们往往会人为地配置一些常用并且描述清晰的问题及其对应的回答,我们将这些配
分类:
编程语言 时间:
2020-11-25 12:58:27
阅读次数:
18
1. 线性回归 X,Y是线性的 是偏置(有点像截距),防止Y为0,矩阵表示时,为全1 :数据集收集的时候有误差(高斯误差,均值为0) 表达向量很相似 D:和,代表所有的数据,和相互独立 2. Basic Expansion 2.1 使用Basis expansion捕捉自变量和因变量的非线性关系 2 ...
分类:
其他好文 时间:
2020-11-25 12:17:37
阅读次数:
7
import matplotlib.pyplot as plt import numpy as np #数据集x,y x,y 都是向量 #给个实例x是身高(m),y是体重(kg) #我们给实际数据x,y训练出最佳的模型 y=ax+b 然后在找个身高x预测体重y x=[0.75,0.85,0.95,1 ...
分类:
编程语言 时间:
2020-11-25 12:04:23
阅读次数:
8
这几期和大家聊聊使用Python进行机器学习Python拥有强大的第三方库,使用Python进行科学计算和机器学习同样需要先配置运行环境。这里我们需要安装Anaconda,官方给出的下载链接太慢,而且经常下载到一半卡死,这里我提供我下载好的:pan.baidu.com/s/1dFA92ZR,密码:p2dt。需要的可以直接快速下载(Python3.5版)。Anaconda自带以下库Numpy、Sci
分类:
编程语言 时间:
2020-11-24 12:51:34
阅读次数:
5
什么是数据中台数据中台是全新的架构变革。过去三十年,企业数据管理都以传统的IT架构为基础。每当技术部门为业务部门解决问题时,需要从业务需求的探查、技术壁垒的打通等从上到下各个方面来建设新系统。每个系统的建成都自成一体,各自满足业务部门的需求。这种情况不仅耗费各部门大量的精力也使得各个系统难以打通管理,无法形成更强大的数据能力。图片来源:国云数据此外,目前的IT辅助管理系统是以欧美国家发达的制造业为
分类:
其他好文 时间:
2020-11-23 12:29:42
阅读次数:
5
参数参数分为两种:可学习得到的参数,和超参数。机器学习可以归结为学习一个映射函数f:x→y,将输入变量x映射为输出变量y。一般我们可以假设映射函数为y=f(x,θ)。其中θ即为函数的参数。参数可以通过学习算法进行学习。除了可学习的参数之外,还有一类参数是用来定义模型结构或训练策略的,这类参数叫做超参数(Hyper-Parameter)。超参数和可学习的参数不同,通常是按照人的经验设定,或者通过网格
分类:
其他好文 时间:
2020-11-20 11:17:05
阅读次数:
7