码迷,mamicode.com
首页 > 编程语言
Python 将pdf转换成txt(不处理图片)
上一篇文章中已经介绍了简单的python爬网页下载文档,但下载后的文档多为doc或pdf,对于数据处理仍然有很多限制,所以将doc/pdf转换成txt显得尤为重要。查找了很多资料,在linux下要将doc转换成txt确实有难度,所以考虑先将pdf转换成txt。 师兄推荐使用PDFMiner来处...
分类:编程语言   时间:2014-07-14 10:10:14    阅读次数:249
OSGI(面向Java的动态模型系统)
基本简介编辑OSGI服务平台提供在多种网络设备上无需重启的动态改变构造的功能。为了最小化耦合度和促使这些耦合度可管理,OSGi技术提供一种面向服务的架构,它能使这些组件动态地发现对方。OSGi联OSGI盟已经开发了为例如象HTTP服务器、配置、日志、安全、用户管理、XML等很多公共功能标准组件接口。...
分类:编程语言   时间:2014-07-14 10:13:22    阅读次数:335
Windows C++ 非递归式(stack)深度优先遍历目录
1 #include 2 #include 3 #include 4 #include 5 #include 6 7 typedef void (__stdcall *P_WALK_DIR_CALLBACK)(const std::string &In_strFilePath); 8 ...
分类:编程语言   时间:2014-07-16 19:31:47    阅读次数:256
lucene文件检索(1)-linux java环境配置
最近要处理后台的文件检索,于是在老大的指导下知道了有lucene这种牛B的开源文件检索引擎,于是来学学,lucene得用java开发,所以很明显首先得把环境搭建好,哈哈当然先搭建linux下java了。说到java我又想说说我之前配置java环境变量的时候,老是把jre和jdk混淆了,现在是理清了,...
分类:编程语言   时间:2014-07-16 19:33:50    阅读次数:238
Python发一个GET请求
# -*- coding: utf-8 -*-try: import httplib2except ImportError: print('错误:') print(' httplib2这个库没有找到,程序无法继续运行!') exit(255) def network_get_proc(se...
分类:编程语言   时间:2014-07-16 19:34:14    阅读次数:267
库存调拨 java 实现方式
项目开发中客户提出一个要求: 我只选择商品和数量,完成商品的移库操作在开发中发现这里商品又有批次的问题,那么计算成本的时候又需要根据批次来计算他的成本,那么这样就产生了几个问题 1.当某个商品的这个批次所对应的库存数量足够他调拨时的数量 2.当某个商品的这个批次不够的他需要调拨的数量,我就必须...
分类:编程语言   时间:2014-07-16 19:34:07    阅读次数:253
Java自定义注解
这两天看了一下Java自定义注解的内容,然后按照我自己的理解写了两份代码,还挺有趣的,本文包括三个部分:注解的基础、通过注解进行赋值(结合了工厂方法模式)、通过注解进行校验。
分类:编程语言   时间:2014-07-16 19:39:39    阅读次数:176
怒学Python——第三篇——结构控制
众所周知,程序语句运行的结构无非是顺序结构、分支结构和循环结构,Python也是如此,顺序结构过于简单不提,简单记录一下分支和循环与C++的异同点,顺便提一下,对于已经会C++的人来说,学Python应该注意的是语句块通过缩进来控制。分支结构:都使用if、else,多出了一个elif代替C++的el...
分类:编程语言   时间:2014-07-16 19:39:46    阅读次数:253
JavaScript重复元素处理
判断一个字符串中出现次数最多的字符,统计这个次数//将字符串的字符保存在一个hash table中,key是字符,value是这个字符出现的次数var str = "abcdefgaddda";var obj = {};for (var i = 0, l = str.length; i < l...
分类:编程语言   时间:2014-07-12 13:47:34    阅读次数:272
Java中的图形界面编程
前言正文Java中的图形界面编程AWT/SwingAWT(Abstract Window ToolKits,抽象窗体工具集)1.容器类:用来存储组件,实现容器布局2.组件类:实现界面的一些特定功能一个容器能够包涵多个组件,组件必须存放在容器中3.布局管理器:实现容器的布局设置4.图形类:包含一些基本...
分类:编程语言   时间:2014-07-16 19:42:18    阅读次数:201
几种常用排序算法的python实现
1:快速排序思想:任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序。一趟快速排序的算法是:1)设置两个变量i、j,排序开始的时候:i=0,j=N-1;2)以第一个数组元素作为关键数据,赋值给key,即key...
分类:编程语言   时间:2014-07-16 19:43:40    阅读次数:202
java命令行操作
一直使用eclipse操作java程序,但RMI程序需要命令行操作,故研究了下java的命令行操作。javac 用于编译.java文件,生成.class文件假设文件夹dir下有pa.java和a.java,并且a用到了pa的实例,那么在编译a时,是需要.class文件的。即编译程序时,程序之间的依赖...
分类:编程语言   时间:2014-07-16 19:44:41    阅读次数:194
javascript jquery数组操作小结
----------------------------------------------------------定义数组----------------------------------------------------------$(function(){ var aArray = {};...
分类:编程语言   时间:2014-07-16 19:46:09    阅读次数:189
使用JSON JavaScriptSerializer 进行序列化或反序列化时出错。字符串的长度超过了为 maxJsonLength属性
使用 JSON JavaScriptSerializer 进行序列化或反序列化时出错。字符串的长度超过了为 maxJsonLength 属性设置的值。解决办法是在web.config增加如下节点到下
分类:编程语言   时间:2014-07-16 19:47:22    阅读次数:188
java web开发中,如何查看JSP和Servlet版本 (转)
原文出处:http://blog.163.com/qiu_yin_good/blog/static/16732934920123277481492/在看《struts2权威指南》的时候,书上很多处都提到环境要支持的JSP,Servlet版本。如果版本低,会出现异常。或者需要修改web.xml等。现在...
分类:编程语言   时间:2014-07-16 19:47:31    阅读次数:210
C语言 链队列基本操作
C语言链队列基本操作#include #include #include /* C语言链队列基本操作 2014年7月11日10:11:41*/typedef int qType;typedef struct node{ qType data; struct node *pNe...
分类:编程语言   时间:2014-07-16 19:48:26    阅读次数:167
C++多态性的浅析
多态性是C++的一个重要特性,【不扯淡直接进入正题】 灵活运用多态,首先得知道类之间的继承。 当B继承了A类后,一般都是公有继承。 B的实例化对象的内存空间结构若是了解 就可以合理利用多态了。 A的内存空间我们假定为a, B的内存空间是这样的结构: a b...
分类:编程语言   时间:2014-07-16 19:49:35    阅读次数:172
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!