1.百度图像识别 文章链接 初赛数据集——链接:https://pan.baidu.com/s/1cT4cjK3Qc3C6Fc_t2uAGEA 密码:ftzk 初赛和决赛代码 2.多标签文本分类 6th博客,1th知乎 ...
分类:
其他好文 时间:
2018-08-10 20:01:07
阅读次数:
132
谷歌做了45万次不同类型的文本分类后,总结出一个通用的“模型选择算法”... 谷歌做了45万次不同类型的文本分类后,总结出一个通用的“模型选择算法”... 2018年07月25日 17:43:55 阅读数:6 2018年07月25日 17:43:55 阅读数:6 阅读数:6 新智元报道 来源:dev ...
分类:
编程语言 时间:
2018-07-29 16:37:52
阅读次数:
150
前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信 ...
分类:
编程语言 时间:
2018-07-19 17:24:21
阅读次数:
188
一、复杂系统 predicting the Unpredictable 1.Math from its birth 最早的数学来自于古埃及土地测量学,中国也出现古老的《九章算术》,逐渐发展成为了物理学、化学等学科的基础,以及我们现在的大数据都是以数学为基础,都是因为数学模型这个对现实抽象的一个工具。 ...
分类:
其他好文 时间:
2018-07-18 14:13:54
阅读次数:
163
贝叶斯分类首先准备好数据材料 第一次获取20newsgroups时会花费数分钟时间来获取数据,通过获得target_names可以查看其中的类型。 为了进行分类,采用词袋模型的方法,即统计每篇新闻的单词,不考虑单词间的联系,仅仅考虑它们出现的频率。 11314代表有11314篇文章,130107意思 ...
分类:
其他好文 时间:
2018-07-13 22:20:25
阅读次数:
348
总览 用途:文本分类 优点:在精度上与深度学习的方法媲美,但更高效,速度快多个数量级。 模型结构 fastText的结构:输入为一个句子的N个词(ngram)的向量表示,训练之前此向量可利用随机数进行初始化,随后将这些词向量加权平均得到对应文本的向量表示;输出为文本对应的标签。此模型结构与CBOW很 ...
分类:
其他好文 时间:
2018-07-12 20:15:49
阅读次数:
168
理论 什么是朴素贝叶斯算法? 朴素贝叶斯分类器是一种基于贝叶斯定理的弱分类器,所有朴素贝叶斯分类器都假定样本每个特征与其他特征都不相关。举个例子,如果一种水果其具有红,圆,直径大概3英寸等特征,该水果可以被判定为是苹果。尽管这些特征相互依赖或者有些特征由其他特征决定,然而朴素贝叶斯分类器认为这些属性 ...
分类:
编程语言 时间:
2018-07-07 20:41:29
阅读次数:
197
今日完成任务情况 杜世康:弹幕数据的分析 刘丹:弹幕数据的分析 李玉莹:弹幕数据的分析 曹莹雯:数据可视化 尹楠: 数据可视化 王静雅:数据可视化并撰写Beta冲刺博文 以下是英雄联盟直播间部分弹幕数据的分析结果 关键字提取 文本分类 情感分析 从情感分析结果来看,网友的负面情绪58.93%,正面情 ...
分类:
其他好文 时间:
2018-06-26 22:37:47
阅读次数:
240
NLPIR能够全方位多角度满足应用者对大数据文本的处理需求,包括大数据完整的技术链条:网络采集、正文提取、中英文分词、词性标注、实体抽取、词频统计、关键词提取、语义信息抽取、文本分类、情感分析、语义深度扩展、繁简编码转换、自动注音、文本聚类等。 ...
分类:
编程语言 时间:
2018-06-22 13:29:29
阅读次数:
215
文本挖掘 (Text Mining)是从非结构化文本信息中获取用户感兴趣或者有用的模式的过程。 文本挖掘是指从大量文本数据中抽取事先未知的、可理解的、最终可用的知识的过程,同时运用这些知识更好地组织信息以便将来参考 。 文本预处理 文本处理的核心任务是把非结构化和半结构化的文本转换为结构化的形式,即 ...
分类:
其他好文 时间:
2018-06-04 22:31:18
阅读次数:
248