决策树算法优缺点:优点:计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关的特征数据缺点:可能会产生过度匹配的问题适用数据类型:数值型和标称型算法思想:1.决策树构造的整体思想:决策树说白了就好像是if-else结构一样,它的结果就是你要生成这个一个可以从根开始不断判断选择到叶子节...
分类:
编程语言 时间:
2014-11-15 16:52:34
阅读次数:
279
最近在做一个漏洞展示平台,攻击实现部分使用python实现,c语言实现部分使用libcli库做一个类似telnet的东东,回调函数run的时候调用python模块。针对c调用python,做个了小demo
python模块:demo.py
def print_arg(str):
print str
def add(a,b):
print 'a=', a
print...
分类:
编程语言 时间:
2014-11-15 00:15:46
阅读次数:
311
本文提供了一种准确判断请求是否是搜索引擎发出请求的方法,非通过UserAgent判断,提供了Python实现判断的核心代码,和一个web工具!提供了常见搜索引擎蜘蛛的IP段,快速判断可以通过IP段判断
分类:
其他好文 时间:
2014-11-15 00:01:19
阅读次数:
196
本文提供了一种准确判断请求是否是搜索引擎发出请求的方法,非通过UserAgent判断,提供了Python实现判断的核心代码,和一个web工具!...
分类:
其他好文 时间:
2014-11-14 22:46:25
阅读次数:
150
kNN算法算法优缺点:优点:精度高、对异常值不敏感、无输入数据假定缺点:时间复杂度和空间复杂度都很高适用数据范围:数值型和标称型算法的思路:KNN算法(全称K最近邻算法),算法的思想很简单,简单的说就是物以类聚,也就是说我们从一堆已知的训练集中找出k个与目标最靠近的,然后看他们中最多的分类是哪个,就...
分类:
编程语言 时间:
2014-11-14 21:00:57
阅读次数:
321
1.小时钟获取当前时间并用打印在Console上2.上代码1 import time,sys,os2 while(1):3 t = time.strftime('%H:%M:%S',time.localtime(time.time()))4 sys.stdout.write(t+'\...
分类:
编程语言 时间:
2014-11-13 22:03:07
阅读次数:
159
最近发现天涯论坛是一个挺有意思的网站,有各种乱七八糟的帖子足以填补无聊时候的空虚感,但是相当不爽的一件事就是天涯的分页模式下想连贯的把楼主的内容看完实在是太心酸了,一个999页的帖子,百分之九十都是无聊网友的灌水,有时候连续翻几十页才能找到楼主的一条内容。所以无聊之下,就打算写一个简单的爬虫,能一次...
分类:
编程语言 时间:
2014-11-12 22:57:44
阅读次数:
762
接口的类型有很多,但是我们经常遇见经常用的就get和post两种。这两种有什么区别呢?个人理解主要是表现在安全性方面。Python代码POST任意的HTTP数据以及使用Cookie的方法,有需要的朋友可以参考下。1)、不使用Cookie时,发送HTTP POST还是非常简单的:import ur.....
分类:
编程语言 时间:
2014-11-10 17:07:16
阅读次数:
185
例如定义一个矩阵: 1 >>> a=mat([[1,2,3],[2,3,4]]) 2 >>> a 3 matrix([[1, 2, 3], 4 [2, 3, 4]]) 5 >>> sum(a) 6 15 7 >>> sum(a[0]) 8 6 9 >>> sum(a[1])10 91...
分类:
编程语言 时间:
2014-11-09 23:33:58
阅读次数:
1212
Apriori算法是数据挖掘中频发模式挖掘的鼻祖,从60年代就开始流行,其算法思想也十分简单朴素,首先挖掘出长度为1的频繁模式,然后k=2
将这些频繁模式合并组成长度为k的频繁模式,算出它们的频繁次数,而且要保证其所有k-1长度的子集也是频繁的,值得注意的是,为了避免重复,合并的时候,只合并那些前k-2个字符都相同,而k-1的字符一边是少于另一边的。
以下是算法的Python实现:
__au...
分类:
编程语言 时间:
2014-11-08 15:20:43
阅读次数:
191