码迷,mamicode.com
首页 >  
搜索关键字:python    ( 135041个结果
用Python做SVD文档聚类---奇异值分解----文档相似性----LSI(潜在语义分析)
转载请注明出处:电子科技大学EClab——落叶花开http://www.cnblogs.com/nlp-yekai/p/3848528.htmlSVD,即奇异值分解,在自然语言处理中,用来做潜在语义分析即LSI,或者LSA。最早见文章An introduction to latent semanti...
分类:编程语言   时间:2014-07-19 16:10:01    阅读次数:418
python 3Des 加密
import hashlib;from Crypto.Cipher import DES3import base64def create_key(sk): r=hashlib.md5(sk).digest() return r+r[:8]def init_str(s): l=len(s) % 16 ...
分类:编程语言   时间:2014-07-19 16:07:32    阅读次数:192
如何设置python的编码格式为utf-8
重装了系统(ubuntu 14.04)原来正常可用的OpenERP项目在切换到开发者模式的时候报错:UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)而在服...
分类:编程语言   时间:2014-07-19 16:02:16    阅读次数:242
解决Scrapy shell启动出现UnicodeEncodeError问题
windows 命令行编码是cp936,而D:\Python27\Scripts\scrapy脚本编码是Unicode编码顾在命令行启动会出现编码问题解决办法:修改D:\Python27\Scripts\ 下的scrapy文件,这个文件即scrapy命令的程序文件,加上如下代码即可:import s...
分类:其他好文   时间:2014-07-19 14:21:14    阅读次数:209
【Cocos2d-x 3.0】游戏开发之win32配置环境搭建工程
Build Requirements ------------------ * Mac OS X 10.7+, Xcode 4.6+ * or Ubuntu 12.10+, CMake 2.6+ * or Windows 7+, VS 2012+ * Python 2.7.5 Runtime Requirements --------------------   * i...
分类:Windows程序   时间:2014-07-19 13:44:19    阅读次数:273
[转]Django与遗留系统和数据库集成
From:http://www.czug.org/python/django/17.html尽管Django最适合从零开始开发项目--所谓的"绿色领域"开发--将框架与遗留系统和数据库集成是可能的,本章解释一些集成策略与遗留数据库集成Django的数据库层从Python代码生成SQL schemas...
分类:数据库   时间:2014-07-19 13:39:16    阅读次数:250
数学之路-python计算实战(15)-机器视觉-滤波去噪(归一化块滤波)
# -*- coding: utf-8 -*- #code:myhaspl@myhaspl.com #归一化块滤波 import cv2 import numpy as np fn="test3.jpg" myimg=cv2.imread(fn) img=cv2.cvtColor(myimg,cv2.COLOR_BGR2GRAY) #加上高斯噪声,可以参考以前博文中的内容 ...... ....
分类:编程语言   时间:2014-07-19 12:01:38    阅读次数:362
用python调用七牛的fetch接口保存网络上的图片
需求说明 七牛是个好东西 免费10G空间10G下载流量10w上传请求100w下载请求 自带CDN和图片处理 对于个人用户和创业公司来说是个很好的平台 本文主要是解决 服务器端请求七牛对网络某文件进行保存这一业务需求 这里是七牛文章中对Fetch API的说明。写的有点复杂,不过用Python sdk比较简单 SDK安装 一般安装 七牛的Python sdk支持 pip...
分类:编程语言   时间:2014-07-19 11:25:53    阅读次数:288
文本分类之情感分析– 去除低信息量的特征
当你的分类模型有数百个或数千个特征,由于是文本分类的情况下,许多(如果不是大多数)的特点是低信息量的,这是一个不错的选择。这些特征对所有类都是通用的,因此在分类过程中作出很小贡献。个别是无害的,但汇总的话,低信息量的特征会降低性能。 通过消除噪声数据给你的模型清晰度,这样就去除了低信息量特征。它可以把你从过拟合和维数灾难中救出来。当你只使用更高的信息特征,可以提高性能,同时也降低了模型的大小...
分类:其他好文   时间:2014-07-19 11:22:54    阅读次数:507
文本分类之情感分析– 停用词和惯用语
改善特征提取往往可以对分类的accuracy(和precision和召回率)有显著的正面影响。在本文中,我将评估word_feats的两项修改特征提取的方法: 过滤停用词 包含二元语法搭配 为了有效地做到这一点,我们将修改前面的代码,这样我们就可以使用任意的特征提取函数,它接收一个文件中的词,并返回特征字典。和以前一样,我们将使用这些特征来训练朴素贝叶斯分类器。 ...
分类:其他好文   时间:2014-07-19 11:22:04    阅读次数:593
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!