原文:使用HttpWebRequest和HtmlAgilityPack抓取网页(拒绝乱码,拒绝正则表达式)废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时...
分类:
Web程序 时间:
2014-06-27 20:32:13
阅读次数:
270
折磨了几个小时,写出匹配SQL语句中的所有表名,备忘记录1 \*\s+from\s+[\w\[\]]*\.?[\w\[\]]*\.?\[?(\b\w+)\]?[\r\n\s]*支持各种表达式SELECT * FROM Config SELECT * FROM [dbo].IMEIUser SELEC...
分类:
数据库 时间:
2014-06-26 19:37:10
阅读次数:
548
正则表达式非常好,但在数据库中就是没有,但可以通过程序集方式扩展先编写一个dll,标量函数很好写,表值函数麻烦一点下面是C#代码using System;using System.Data;using System.Data.SqlClient;using System.Data.SqlTypes;...
分类:
数据库 时间:
2014-06-26 19:10:35
阅读次数:
297
其实以前我偷偷学习正则表达式的时候,写过一个getbyclass的方法,最近翻了翻到处都是错,或者好多重复的,没有用的 代码,于是显得没事我就把这个精简了一下,其实这个方法现在我觉得也是有问题的,问题在于我不知道原生的getElementsByClassName获取元素后生产的是不是数组,不管这个到...
分类:
其他好文 时间:
2014-06-26 18:13:42
阅读次数:
154
正则表达式语法一个正则表达式就是由普通字符(例如字符a到z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。如:JScriptVBScript匹配/^\[\t]*$/"^\[\t]*$"匹配...
分类:
其他好文 时间:
2014-06-26 17:56:14
阅读次数:
173
废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时候,我崩溃了,http请求后,得到的是字符串竟然是乱码,然后就各种百度(谷歌一直崩溃中),最后找到了原因。...
分类:
Web程序 时间:
2014-06-26 12:57:58
阅读次数:
373
最近在尝试使用Zsh,发现其补全命令的功能相当厉害。但对CMake命令的补全在默认的5.0.5中好像没有看到,网上找了下关于配置Zsh补全的文章也没有多少。 于是自己动手,发现在Zsh安装目录下有个functions的文件夹,里面都有以_开头的各种补全提示文件,比如_sed,_awk等,于是尝试.....
分类:
其他好文 时间:
2014-06-26 12:55:10
阅读次数:
199
废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时候,我崩溃了,http请求后,得到的是字符串竟然是乱码,然后就各种百度(谷歌一直崩溃中),最后找到了原因。...
分类:
Web程序 时间:
2014-06-26 12:53:48
阅读次数:
232
自己学习《APUE》时写的linux下一些命令(大概40个左右)实现,仅当学习使用,这些命令包括cat cp echo head ls paste rmdir tail umask who chattr cut expand join mkdir pwd sed tee uniq chgrp date find last mkfifo reboot sort wc chmod df ln mv rename split touch which chown du grep lsattr od rm tac t...
分类:
编程语言 时间:
2014-06-26 10:51:39
阅读次数:
423
监控服务器剩余空间脚本:#visize.sh按a或i进入编辑模式#!/bin/bashName=`hostname`Date=`date+%m%d%y`Size=`/bin/df-h/home|grepT|awk-F[:""]+‘{print$5}‘`Size2=`/bin/df-h/home|grepT|awk-F[:""]+‘{print$5}‘|tr-d‘%‘`Size3=`/bin/df-h/home|grepT|awk-F[:""]+‘{print$4}‘`i..
分类:
其他好文 时间:
2014-06-26 06:14:02
阅读次数:
303