赛题解读: https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.6.6406111aIKCSLV&postId=118252 赛题报名: https://tianchi.aliyun.com/competition ...
分类:
其他好文 时间:
2020-07-22 01:47:35
阅读次数:
92
NLP——新闻文本处理:TASK1 赛题理解与nlp初识 1.数据读取 在竞赛主页下载好数据集利用pandas打开: #coding=utf-8 import pandas as pd #my_font = font_manager.FontProperties(fname="C:\Windows\ ...
分类:
其他好文 时间:
2020-07-21 23:13:12
阅读次数:
112
做机器学习的时候经常用到XGB,简单记录一下 K折交叉验证也是模型常用的优化方法。一起记录。。。 K折交叉验证:类似三个臭皮匠,顶个诸葛亮。我的理解是,就是用民主投票的方式,选取票数最高的那个当结果。K折就是分成K份数据来进行。K= 5就是5折交叉验证,K= 7就是7折交叉验证,K=10就是10折。 ...
分类:
其他好文 时间:
2020-07-18 22:48:42
阅读次数:
81
从RNN到BERT 一年前的这个时候,我逃课了一个星期,从澳洲飞去上海观看电竞比赛,也顺便在上海的一个公司联系了面试。当时,面试官问我对RNN的了解程度,我回答“没有了解”。但我把这个问题带回了学校,从此接触了RNN,以及它的加强版-LSTM。 时隔一年,LSTM好像已经可以退出历史舞台。BERT站 ...
分类:
其他好文 时间:
2020-07-18 15:30:10
阅读次数:
449
昨天学习了简单的文本处理,之后在课后的练习中实现了包括了对tf-idf的处理和基于朴素贝叶斯简单的文本分类 基于tf-idf的数据集在出现多个关键词的时候一般能够相对准确对文本进行分类,但是对于相对具有深层含义的内容,例如情感的积极,情感的消息这方面的分类来说,就显得有些乏力的。根据昨天构建的文本分 ...
分类:
其他好文 时间:
2020-07-09 10:48:09
阅读次数:
72
目录 单层神经网络 RNN原理 经典RNN结构 N VS 1 RNN结构 1 VS N RNN结构 Pytorch文本分类实践 参考资料 RNN 的英文全称是 Recurrent Neural Networks ,即循环神经网络,他是一种对序列型数据进行建模的深度模型。在学习之前,先来复习基本的单层 ...
分类:
其他好文 时间:
2020-07-05 00:51:47
阅读次数:
318
情感分析:基于卷积神经网络 Sentiment Analysis: Using Convolutional Neural Networks 探讨了如何用二维卷积神经网络来处理二维图像数据。在以往的语言模型和文本分类任务中,把文本数据看作一个一维的时间序列,自然地,使用递归神经网络来处理这些数据。实际 ...
分类:
其他好文 时间:
2020-07-02 19:54:11
阅读次数:
102
情感分析:基于循环神经网络 Sentiment Analysis: Using Recurrent Neural Networks 与搜索同义词和类比词类似,文本分类也是单词嵌入的一个下游应用。在本文中,将应用预训练的词向量(glow)和具有多个隐藏层的双向递归神经网络,如图1所示。将使用该模型来判 ...
分类:
其他好文 时间:
2020-07-02 18:13:49
阅读次数:
55
转自https://www.cnblogs.com/jermmyhsu/p/8195727.html 有待学习 Bag of Feature 是一种图像特征提取方法,它借鉴了文本分类的思路(Bag of Words),从图像抽象出很多具有代表性的「关键词」,形成一个字典,再统计每张图片中出现的「关键 ...
分类:
其他好文 时间:
2020-07-01 23:39:29
阅读次数:
66
不积跬步无以至千里,不积小流无以成江海!每天一点点,以达到积少成多之效! word2vec 概念,数学原理理解 1.数据集 Kaggle上的电影影评数据,包括unlabeledTrainData.tsv,labeledTrainData.tsv,testData.tsv三个文件 Strange th ...
分类:
其他好文 时间:
2020-06-24 23:51:31
阅读次数:
72