1.问题描述
进行文本分析的时候需要将中文和非中文进行分开处理,下面通过Python将文本中的中文部分提取出来进行需要的处理。
2.问题解决
开发环境:Linux
程序代码如下:split.py
#!/usr/bin/python
#-*- coding:utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding("ut...
分类:
编程语言 时间:
2014-12-31 18:35:56
阅读次数:
365
状况:遇到android程序中后入栈的一个Activity需要更新之前一个或者两个以上Activity中的数据时使用,或者需要在adapter中修改Activity或者fragment的数据和ui等
[1].[代码] [Java]代码 跳至
[1]
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
...
分类:
其他好文 时间:
2014-12-31 18:36:46
阅读次数:
225
Hadoop二次排序的其他写法
二次排序原理
在map阶段,使用job.setInputFormatClass定义的InputFormat将输入的数据集分割成小数据块splites,同时InputFormat提供一个RecordReder的实现。
本例子中使用的是TextInputFormat,他提供的RecordReader会将文本的字节偏移量作为key,这一行的文本作为value。
这...
分类:
编程语言 时间:
2014-12-31 18:34:28
阅读次数:
316
/**
* 网络状态 wifi mobile
*
* @author jiangbing
*
*/
public class NetworkUtils {
/**
* 判断当前是否 网络连接 (是否有效的连接)不分wifi mobile
*/
public static boolean isConnectdeAvailable(...
分类:
移动开发 时间:
2014-12-31 18:34:07
阅读次数:
147
学习自网络, 不喜勿喷, 仅用作个人参考
IP地址由 网络地址 + 主机地址 组成.
IP地址分为三大类:
A类 : 10.0.0.0 ~ 10.255.255.255 默认子网掩码: 255.0.0.0
B类 : 172.16.0.0 ~ 172.131.255.255 默认子网掩码: 255.255.0.0
C类 : 192.168.0.0 ~ 192.168.255.2...
分类:
其他好文 时间:
2014-12-31 18:34:35
阅读次数:
141
POJ2456 Aggressive cows (二分)...
分类:
其他好文 时间:
2014-12-31 18:33:35
阅读次数:
124
一次惊心动魄的Percona XTRA Cluster DB数据修复过程 看后,让你不再担心MySQL难以修复。当然,最好提前做好MySQL HA方案。...
分类:
数据库 时间:
2014-12-31 18:34:03
阅读次数:
214
安装xhprof(如果有错误,要make clean,重新编译)
1 下载xhprof
#wget (去官网下载)
#tar zxf xx.gz(下下来的文件)
2 cd xhprof
cd extension
/usr/local/php/bin/phpize(用自己环境里的phpize路径)
./configure --enable-xhpro...
分类:
其他好文 时间:
2014-12-31 18:35:21
阅读次数:
177
Spring为在Web MVC应用程序中很可能要用到的大多数视图技术提供了一流的支持。
SpringMVC同时支持多视图例如JSP,Velocity,Freemarker等。通过不同的请求路径配置规则,映射到不同的视图文件。通过Controller返回的视图模型将页面显示出来。
JSP
JSP被编译为servlet并拥有完整的java语言能力,因...
分类:
编程语言 时间:
2014-12-31 18:34:03
阅读次数:
246
一、开源史上最成功的八个开源软件
就开源本身而言,它就是个成功案例。它不仅受个人喜欢,而且众多知名企业也青睐于它。虽然开源计划和开源产品数不胜数,但哪一个才是最成功的呢?这里所说的“成功”的定义是:应用广泛+众所周知。而在众多成功的开源产品中,只有少数领头羊,而其他产品基本只能望其项背。
Linux
上榜理由:Linux + GNU = GNU/Linux 。从Linus Torva...
分类:
其他好文 时间:
2014-12-31 18:34:32
阅读次数:
1167
对平面上的一些点拟合有很多手段,其中椭圆拟合在图像轮廓划分等很多方面都很重要,当然,我们一般还是用最小二乘法来拟合椭圆,
在这里,我实现了两种算法,一种是
http://wenku.baidu.com/link?url=7kIrC8LoOMCtlmAH8yqkpUQfiKwWnVe4EoUJekkQSgQ1qTWfLAuEXTYvYTv7SATGIJYX4IxcTIB94-i...
分类:
其他好文 时间:
2014-12-31 18:34:49
阅读次数:
185
2014年的最后一天,我还是在碌碌无为中度过,那么我索性就开始总结一下我今年的工作生活,也算对逝去的一年进行一个回顾和总结。...
分类:
其他好文 时间:
2014-12-31 18:34:46
阅读次数:
167
一、UML图
二、概念
访问者模式(Visitor):表示一个作用于某对象结构中的各元素的操作。它是你可以在不改变各元素的类的前提下定义作用于这些元素的新操作。
三、说明
(1)访问者模式适用于数据结构相对稳定的系统?
是的。它把数据结构和作用于数据结构上的操作之间的耦合解脱开,使得操作集合可以相对自由地演化。
(2)访问者模式的目的?
访问者模式的目的是要把...
分类:
编程语言 时间:
2014-12-31 18:34:36
阅读次数:
198
一、概述
位于javax.net.ssl包下。声明:public interface
HostnameVerifier
此类是用于主机名验证的基接口。
在握手期间,如果 URL 的主机名和服务器的标识主机名不匹配,则验证机制可以回调此接口的实现程序来确定是否应该允许此连接。
策略可以是基于证书的或依赖于其他验证方案。
当验证 URL 主机名使用的默认规则失败时使用这些回调。
...
分类:
编程语言 时间:
2014-12-31 18:33:40
阅读次数:
801
摘要:
主要记录了在Windows和Linux下常用的端口操作、比如查看端口是否占用、如何结束相应进程释放端口、Linux下如何通过防火墙配置文件开启指定端口。...
??
spring 中集成quartz:
spring文件的配置:
<beans
xmlns="http://www.springframework.org/schema/beans"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:p="http://www.springframework.org/schema...
分类:
编程语言 时间:
2014-12-31 18:33:45
阅读次数:
218