标签:专业 mic sys write txt font bsp python 文本
部门负责工业领域知识图谱构建,用于工业化与信息化两化融合,听起来好高大上好难,反正目前的我还理解不了那么深,好在有部门经理带领。
想要做专业领域知识图谱首先要有专业领域知识,这些知识从哪来呢?主要来源肯定是从互联网上爬啦!
爬下来一大堆知识直接堆在那肯定不行,还要建立起相互关系,其中重要一项就是文本分类啦!那么怎么分类呢?
还是以后再说吧。。。因为不管怎么做,首先都要把数据库里自己想要的数据取出来。
#coding=utf-8 import sys reload(sys) sys.setdefaultencoding(‘utf-8‘) from pymongo import MongoClient #建立MongoDB数据库连接 client = MongoClient(‘IP‘, 27017) #用户验证 db = client.库名 db.authenticate("账号", "密码") #连接所用集合,也就是我们通常所说的表 collection=db.表名 #接下里就可以用collection来完成对数据库表的一些操作 with open (‘文件名.txt‘, ‘wb‘) as f:
#接下来可实现提取想要的字段内的数据 for item in collection.find({}, {"Summary":1,"Manual":1,"Claim":1,"_id":0}): if item.has_key(‘Summary‘) and item[‘Summary‘]: f.write(item[‘Summary‘]) if item.has_key(‘Manual‘) and item[‘Manual‘]: f.write(item[‘Manual‘]) if item.has_key(‘Claim‘) and item[‘Claim‘]: f.write(item[‘Claim‘]) f.write(‘\n‘)
Python连接mongodb提取部分字段内数据并写入txt文件
标签:专业 mic sys write txt font bsp python 文本
原文地址:http://www.cnblogs.com/zhangtianyuan/p/6874855.html