Log-Linear 模型(也叫做最大熵模型)是 NLP 领域中使用最为广泛的模型之一,其训练常采用最大似然准则,且为防止过拟合,往往在目标函数中加入(可以产生稀疏性的) L1 正则。但对于这种带 L1 正则的最大熵模型,直接采用标准的随机梯度下降法(SGD)会出现效率不高和难以真正产生稀疏性等问题。本文为阅读论文 Stochastic Gradient Descent Training for L1-regularized Log-linear Models with Cumulative Penalty...
分类:
其他好文 时间:
2014-06-19 12:01:04
阅读次数:
286
Source: http://cpprocks.com/wp-content/uploads/c++11-regex-cheatsheet.pdf
分类:
编程语言 时间:
2014-06-16 00:05:54
阅读次数:
441
在以前的项目中周公曾有解析HTML的情况,当时是采用正则表达式一步步将无关的HTML注释及JS代码部分删除掉,然后再用正则表达式找出需要提取的部分,可以说使用正则表达式来做是一个比较繁琐的过程,特别是对于正则表达式不是很熟悉或者要处理的HTML很复杂的情况下。前一阵子周公还是通过这个办法将http:...
分类:
Web程序 时间:
2014-06-16 00:00:02
阅读次数:
325
运用.NET Framework类来解析HTML文件、读取数据并不是最容易的。虽然你可以用.NET Framework中的许多类(如StreamReader)来逐行解析文件,但XmlReader提供的API并不是“取出即可用(out of the box)”的,因为HTML的格式不规范。你可以用正则...
分类:
Web程序 时间:
2014-06-15 23:23:58
阅读次数:
712
$(function () { $("#txtPhone").focus(function () { $(this).next().show().removeClass("onError").removeClass("onright").addClass("ontan").ht...
分类:
其他好文 时间:
2014-06-15 22:44:27
阅读次数:
346
文本处理工具之二 sed命令详解
sed:Stream Editor文本流编辑,sed是一个“非交互式的”面向字符流的编辑器。能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件输入到屏幕,可以把只匹配到模式的内容输入到屏幕上。还可以对原文件改动,但是不会再屏幕上返回结果。
sed命令的语法格式:
sed的命令格式: sed [op...
分类:
其他好文 时间:
2014-06-15 07:49:58
阅读次数:
242
1 2 3 4 5 示例-表单校验-涉及的正则校验 6 9 10 11 12 13 88 89 90
用户名称: 91 92 93 输入密码: 94 95 96 确认密码:...
分类:
其他好文 时间:
2014-06-13 15:23:55
阅读次数:
294
Source:
http://cpprocks.com/wp-content/uploads/c++11-regex-cheatsheet.pdf
分类:
编程语言 时间:
2014-06-13 14:57:19
阅读次数:
313