虽然多数高手认为正则会影响程序效率,但是做数据采集的时候,却很难避免使用正则, 强大的正则表达式用起来很舒服,但是在匹配中文的时候,会出现,明明正则表达式没问题,字符数据里包含符合正则表达式的数据,可就是抓不到,这时候,就该停下来,看一下,你所匹配的数据编码,与你的PHP脚本文件编码格式是否一致
分类:
Web程序 时间:
2014-08-17 17:01:32
阅读次数:
199
背景介绍 爬虫系统:一台是control server,其他的100台做crawler。server每天定时分发采集任务。 问题出现:由于目标采集任务比较大,准备增加10台crawler。期望在不改变原有任务分配规 则的基础上,同时优先分配任务少的机器上,而且能够对任务较少的机器进行平均分配(...
分类:
其他好文 时间:
2014-08-17 02:18:31
阅读次数:
258
以前没有写过,这是第一次写,用词不当,表述不清楚的地方请见谅。希望大家多提建议,谢谢。网络爬虫常常被人所忽略,特别是和搜索引擎的光环相比,它似乎有些暗淡无光。我很少看见有详细介绍爬虫实现的文章或者文档。然而,爬虫其实是非常重要的一个系统,特别是在今天这个数据为王的时代。如果你是一个刚刚开始的公司或者...
分类:
其他好文 时间:
2014-08-17 02:17:01
阅读次数:
506
Dynamic Web TWAINTWAIN扫描识别工具添加文本到图像Dynamic Web TWAIN是应用于Web应用程序的TWAIN扫描识别工具,只需在TWAIN接口写几行代码,就可以用兼容TWAIN的扫描仪扫描文档或从数码相机/采集卡中获取图像,并对采集下来的图像进行处理。版本支持Dynam...
分类:
Web程序 时间:
2014-08-16 18:27:10
阅读次数:
234
Zabbix是一个高度集成的网络监控解决方案,可以提供企业级的开源分布式监控解决方案。被监控端:主机通过安装agent方式采集数据,网络设备通过SNMP方式采集数据Server端:通过收集SNMP和agent发送的数据,写入数据库(MySQL,ORACLE)再通过php+apache在web前端展示。zabbix运..
分类:
其他好文 时间:
2014-08-15 02:58:29
阅读次数:
245
三层架构已经学习了一段时间,机房收费系统的重构也正在进行,关于三层的认识正在不断加深,对于三层架构,我也简单谈谈我的认识!
什么是?
顾名思义,将一个软件系统的业务应用分为了三层,分别是:表现层(UI)、业务逻辑层(BLL)、数据访问层(DAL)
为什么?
高内聚,低耦合
怎么用?
表现层(UI,user interface)
作用:用户使用的界面,向用户展现特定业务数据,采集用户的...
分类:
其他好文 时间:
2014-08-15 00:08:16
阅读次数:
323
Modbus通讯协议是由Modicon公司在1979年开发的,应用于工业现场控制的总线协议。Modbus通讯系统包括带有可编程控制的芯片节点和公共传输线组成,其目的是用于多节点数据的采集和监控。Modbus协议采用主从模式,通讯系统中有一个主机对多个节点从机进行监控,从机节点最多支持247个。每个从机均有自己独立的从机地址,而且改地址能够被主机识别。
能够支持Modbus协议的通讯系统有RS-2...
分类:
数据库 时间:
2014-08-15 00:02:46
阅读次数:
704
MediaRecorder除了可以用于录制音频,还可用于录制视频。使用MediaRecorder录制视频与录制音频的步骤基本相同。只是录制视频时不仅需要采集声音,还需要采集图像。为了让MediaRecorder录制时采集图像,应该在调用setAudioSource(int audio source)方法时再调用setVideoSource(int video source)方法来设置图像来源。...
分类:
移动开发 时间:
2014-08-14 20:33:59
阅读次数:
250
客户的一台现场采集电脑崩溃,无法启动。用PE引导后,将MDF和LDF数据复制出来,往正常的数据库附加时,报如下错误:处理数据库'databasename'的日志时出错。如果可能,请从备份还原。如果没有可用备份,可能需要重新生成日志。无法打开新数据库'databasename'。CREATEDATAB...
分类:
数据库 时间:
2014-08-14 19:40:19
阅读次数:
750