码迷,mamicode.com
首页 > 其他好文 > 详细

第四五周(3.28-4.10)进度及下周计划(4.10组会总结)

时间:2016-05-09 01:31:53      阅读:135      评论:0      收藏:0      [点我收藏+]

标签:

进度:

  我们完成了第一部分内容,即数据爬取和自然语言初步处理

下周计划:

    完善情感词库,进一步情感分析

    开始写工程的WEB界面

 

  爬取的数据都来自东方财富网的股吧,包括标题,内容,作者,时间,以及评论等等,爬取的数目条数有几百万条,部分数据展示如下:

技术分享

部分函数如下:

技术分享

技术分享

技术分享

技术分享

将爬取的数据存入mongodb中再进行情感分析和自然语言处理,将处理后的结果通过WEB界面展示。

 

第四五周(3.28-4.10)进度及下周计划(4.10组会总结)

标签:

原文地址:http://www.cnblogs.com/SWERUC-sunny/p/5472419.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!