中文分词其实有点像古代的句读(dou),韩愈的《师说》中就有:“彼童子之师,授之书而习其句读者也”。古人文章是没有标点符号的,行文一气呵成。如果不懂离经断句,就很难理解古文的意思。从某种程度上,句读就类似今天要讲的中文分词。
北京航空航天大学的梁南元教授提出了查字典的方法
查字典的方法就是把句子从左到右扫描一遍,遇到字典里有的词就标示出来,遇到不认识的字串就分割为单字词。如果分割出的词与后面的...
分类:
其他好文 时间:
2015-08-07 23:58:13
阅读次数:
313
关于Scala中高阶函数、SAM转换、curring颗粒度、模式匹配讲解
分类:
其他好文 时间:
2015-08-01 18:46:34
阅读次数:
187
在OLAP这类系统或者DW这类数据库中,作为某份报表的数据源,我们常常需要在某个存储过程中编写复杂的运算代码来汇总数据。分析函数便具备这样的能力,引用多行的数据值来进行多层面的聚合运算,在数据子集中进行颗粒度级别的排序控制.分析函数不能嵌套,但是可以通过用视图或者表函数封装然后再套上一层分析函数语法...
分类:
其他好文 时间:
2015-06-24 00:34:06
阅读次数:
127
人穷久了或者累久了会sb
穷且不思变的
累而不知总结的所谓OOP,不过是对世界的认识,总结与表达而已程序的通用结构(架构)思想
模块化:人是一个模块,形成组织模块,形成公司模块,社会模块……;从细了看,原子,分子,器官,人……
问题领域决定了模块的颗粒度
一个萝卜一个坑,萝卜可以替换,因为萝卜都相似
且解耦:...
分类:
其他好文 时间:
2015-06-13 08:41:25
阅读次数:
141
一、定义以及相关概念 互联网的产生带来了机器间通讯的需求,而互联通讯的双方需要采用约定的协议,序列化和反序列化属于通讯协议的一部分。通讯协议往往采用分层模型,不同模型每层的功能定义以及颗粒度不同,例如:TCP/IP协议是一个四层协议,而OSI模型却是七层协议模型。在OSI七层协议模型中展现层(Pre...
分类:
其他好文 时间:
2015-06-12 00:30:41
阅读次数:
169
都是老生常谈的东西,我只是做一个总结。我接触过的权限设计一般都是做成功能类型的,不会颗粒度很细。权限关系有很多种设计与实现,有颗粒度细的,对数据做权限管理的(比较喜欢,一般这样的系统都是需要定制的,很难做到通用化。),颗粒度大的,也就是常用的,大都是根据功能上的划分模块来做。如果是颗粒度比较粗的比如...
分类:
其他好文 时间:
2015-05-18 14:24:30
阅读次数:
78
应群友要求做一个介绍(QQ群:159227188)提供超级管理员才有的控制面板,可以进行账户的添加,角色的分配,功能的分配。一定的权限管理(功能上的权限管理,对于细化颗粒度的权限管理我做不到,比如数据上的权限管理)然后提供简单的图表(一个jquery插件,很不错),一个图片管理器(可以建文件夹,自己...
分类:
Web程序 时间:
2015-05-08 09:21:07
阅读次数:
105
首先简单认识一下硬盘的物理结构,硬盘内部的物理结构很复杂,只能从大的颗粒度去看内部的结构总体来说,硬盘结构包括:盘片、磁头、盘片主轴、控制电机、磁头控制器、数据转换器、接口、缓存等几个部份。所有的盘片(一般硬盘里有多个盘片,盘片之间平行)都固定在一个主轴上..
分类:
其他好文 时间:
2015-04-19 06:45:50
阅读次数:
151
public enum TimeUnit
extends Enum
TimeUnit 表示给定单元粒度的时间段,它提供在这些单元中进行跨单元转换和执行计时及延迟操作的实用工具方法。TimeUnit 不维护时间信息,但是有助于组织和使用可能跨各种上下文单独维护的时间表示形式。
TimeUnit 主要用于通知基于时间的方法如何解释给定的计时参数。
例如,如果 lock 不可用,则以下代码将...
分类:
移动开发 时间:
2015-04-11 10:23:58
阅读次数:
154
对于长篇文档的评审,其实结果是很滑稽的,往往是通过稍作修改。很少有不通过的。而稍作修改就是随便改改。最终文档质量是没有保障的。因此现在条目化文档处理成为了新常态。比如需求是分条起草并评审的,通过就是通过。 diabloneo:确实是这样,我还没遇到完全重写文档的情况因此,有效评审长篇文档的办法就是把长篇文档拆短。需求被分解为小颗粒度的条目,请产品经理或者产品主管逐条确定,让各方理解。us...
分类:
其他好文 时间:
2015-03-28 18:47:54
阅读次数:
124