定义: 特征选择是一个「降维」的过程,是一个去掉无关特征,保留相关特征的过程。从所有特征集中选取最好的一个特征子集。 特征提取是一个将机器学习算法不能识别出来的原始数据转变成可以识别到数据特征的过程。没有「筛选」的操作,不需要考虑特征是否有用,所以并不能称其为降维。 通过实例理解,以文本分类为例: ...
分类:
其他好文 时间:
2019-08-18 23:38:42
阅读次数:
122
先展示效果图: 加载treegrid的json数据格式有两种: (1)基本的数据结构 [{ "id":1, "name":"C", "size":"", "date":"02/19/2010", "children":[{ "id":2, "name":"Program Files", "size" ...
分类:
其他好文 时间:
2019-08-16 18:53:37
阅读次数:
300
今天发布一个PipeCAD版本,主要功能是可以导入IDF/PCF文件后进行三维显示。 ...
分类:
其他好文 时间:
2019-08-11 23:19:21
阅读次数:
108
题号标题已通过代码题解/讨论通过率团队的状态 A All-one Matrices 点击查看 单调栈+前缀和 326/2017 通过 B Beauty Values 点击查看 进入讨论 827/1995 通过 C CDMA 点击查看 进入讨论 669/1115 通过 D Distance 点击查看 ...
在做文本分类聚类的任务时,常常需要从文本中提取特征,提取出对学习有价值的分类,而不是把所有的词都用上,那样会造成维度灾难。因此一些词对分类的作用不大,比如“的、是、在、了”等停用词。这里介绍三种常用的特征选择方法: 无监督方法: TF IDF 监督方法: 卡方 信息增益 互信息 一、TF IDF 一 ...
分类:
其他好文 时间:
2019-08-04 13:32:31
阅读次数:
119
经历了很痛苦的乐鑫官方的idf 编程 后来终于看到了曙光 lua的 NodeMcu 但是NodeMcu 对乐鑫官方api支持的不是太完整,最近又看了NodeMcu 官方的案例,终于在esp32上支持http了但是其他方面支持还是不到位,而且云生成的bin一直都烧录成功后无法运行,至今也不知道啥原因 ...
分类:
编程语言 时间:
2019-07-24 17:58:26
阅读次数:
619
一对一查询 表的创建 增删改查 列类型 django中的列类型我们主要通过和MySQL中列类型对比来看 参数 django-admin django-admin主要是django给我们提供的后台管理系统,我们可以在里面对数据进行增删改查 1、django-admin如何打开 我们创建项目时会自动生成 ...
分类:
其他好文 时间:
2019-07-17 23:08:01
阅读次数:
157
在Ubuntu下安装Nginx有以下方法,但是如果想要安装最新版本的就必须下载源码包编译安装。 一、基于APT源安装 安装好的文件位置: /usr/sbin/nginx:主程序 /etc/nginx:存放配置文件 /usr/share/nginx:存放静态文件 /var/log/nginx:存放日志 ...
分类:
系统相关 时间:
2019-07-16 18:53:53
阅读次数:
183
实现之前,我们要事先说明一些问题: 我们用Redis对数据进行持久化,存两种形式的MAP: key值为term,value值为含有该term的urlkey值为url,value值为map,记录term及在文章中出现的次数总的计算公式如下: 1.计算词频TF这里通过给出url地址,获取搜索词term在 ...
分类:
编程语言 时间:
2019-06-29 12:41:17
阅读次数:
168
既然要说MongoDB数据库,先引入NoSQL的概念。 NoSQL: NoSQL,指的是非关系型的数据库。NoSQL有时也称作Not Only SQL的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称。 NoSQL用于超大规模数据的存储。(例如谷歌或Facebook每天为他们的用户收集万亿比 ...
分类:
数据库 时间:
2019-06-25 09:49:53
阅读次数:
99