现在,Safari(技术预览版106)和Firefox(版本78)的预览版均支持新的CSS :is() 和 :where() 伪类。 Chrome的实施仍然落后。 使用 :is() 减少重复 你可以使用 :is() 伪类来删除选择器列表中的重复项。 /* BEFORE */ .embed .save ...
分类:
Web程序 时间:
2020-07-03 15:57:17
阅读次数:
93
以下是踩过的坑一览🤕: 输入和输出的编码需要分开 (使用不同的向量) 输入的编码最好不固定 (跟随训练调整),输出的编码需要固定 (否则模型会作弊让所有单词的输出编码相同) 输出的编码只能由 0 和 1 组成,不能直接使用浮点数组成的向量 (模型无法调整所有输出到精确的向量,只能调整到方向大致相同 ...
分类:
其他好文 时间:
2020-07-03 11:00:54
阅读次数:
78
SDM:SDM: Sequential Deep Matching Model for Online Large-scale Recommender System
在淘宝的场景中,用户的行为主要分为两种,第一个是当前的浏览session,用户在一个session中,需求往往是十分明确的,比如你想买球... ...
分类:
其他好文 时间:
2020-06-30 00:21:05
阅读次数:
56
用于多领域端到端任务导向对话系统的动态融合网络 摘要 最近的研究表明,大多数神经模型都依赖于大型训练数据,这些数据仅可用于一定数量的任务域,例如导航和调度。这使得难以用有限的标好的数据进行新领域的扩展。但是,关于如何有效地使用来自所有域的数据来提高每个域以及未知域的性能的研究相对较少。为此,我们研究 ...
分类:
Web程序 时间:
2020-06-29 11:16:25
阅读次数:
111
1.SPRING初始化,然后下载过后使用IDEA打开 2.导入之前MVC代码 这里只需要一些小小的改动,需要注意的是项目是基于SPRING运行的。 <dependency> <groupId>org.apache.tomcat.embed</groupId> <artifactId>tomcat-e ...
分类:
编程语言 时间:
2020-06-27 11:19:51
阅读次数:
71
今天读到了一篇论文,感觉很厉害:2006.09661,这篇文章提出了用sine作为激活函数,可以让NN的拟合能力更强,而且具有一些额外的很厉害的性质。 尝试不同的激活函数其实很多人做过,估计使用sin也很多人尝试过,但是估计效果不好就放弃了,但是这里作者提出了只需要用特定的初始化方法,效果飞云之上。 ...
分类:
其他好文 时间:
2020-06-22 21:10:59
阅读次数:
620
跨语言BERT目前还处在大力出奇迹的状态。 首先mBERT发现BERT训练在多语言语料的时候,可以用一种语言微调,测试在另一种语言上。 此后XLM就改进了一下,加入了language embedding。 然后后来发现并没有什么用,还不如增大训练规模来得厉害,于是有了XLM-R,基本上是目前的SOT ...
分类:
编程语言 时间:
2020-06-20 01:24:34
阅读次数:
92
怪你过分美丽 <embed src="//player.video.iqiyi.com/92db14b966f24a4857aeefa3cec5439d/0/0/v_19ry0opves.swf-albumId=16588866600-tvId=16588866600-isPurchase=0-cn ...
分类:
其他好文 时间:
2020-06-18 16:25:09
阅读次数:
118
目录 textRNN简介 textRNN网络结构 总结 一句话简介:textRNN指的是利用RNN循环神经网络解决文本分类问题,通常使用LSTM和GRU这种变形的RNN,而且使用双向,两层架构居多。 一、textRNN简介 这里的文本可以一个句子,文档(短文本,若干句子)或篇章(长文本),因此每段文... ...
分类:
其他好文 时间:
2020-06-17 01:58:03
阅读次数:
72
目录 word2vec 简介 CBOW与Skip-Gram模型 优化方法 优点 word2vec API讲解 三个最常见的应用 一句话简述:2013年Google发明,使用跳字节模型(skip-gram)或连续词袋模型(continuous bag of words ,CBOW)训练词向量(初始位o... ...
分类:
其他好文 时间:
2020-06-16 20:35:06
阅读次数:
50