02 集中趋势的度量 基本概念 异常值: 与其他数据格格不入的极高或极低的数值。 偏斜数据:当异常值将数据向左或向右“拉”时即产生偏斜数据。 众数:众数是频数最大的数值。众数必须存在于数据集中。众数是唯一能用于类别数据 的平均数。 均值 中位数 四分位数:四分位数是这样一些数值,他们将数据一分为四。 ...
分类:
其他好文 时间:
2020-07-17 16:07:23
阅读次数:
95
功能概述 1.1 遥感图像分类的概念 遥感技术能够实现宏观、迅速的大范围信息提取,被各个行业广泛应用。遥感图像分类是图像信息提取的一种方法,是遥感数字图像处理的重要环节之一。 遥感图像分类:根据感兴趣目标在遥感图像上的特征差异,判断并识别其类别属性和空间分布特征等信息的过程。 重点关注: 选择哪些有... ...
分类:
其他好文 时间:
2020-07-16 21:10:58
阅读次数:
64
模板template 每个连接路由使用编程式路由,效率还不是很高,因为每个类别都添加了相同的点击事件,多加了很多回调,浪费内存,可采用事件委派,给相同的父元素添加即可 <div class="all-sort-list2" @click="toSearch"> <div v-for="(c1, in ...
分类:
其他好文 时间:
2020-07-16 11:56:35
阅读次数:
70
前面已经做了类别和连续特征的分析,本文将针对特征工程进行 导入数据 import pandas as pd import numpy as np import matplotlib import matplotlib.pyplot as plt import seaborn as sns %matp ...
分类:
其他好文 时间:
2020-07-15 23:08:45
阅读次数:
90
本篇主要明确消息通知系统的概念和具体实现,包括数据库设计、技术方案、逻辑关系分析等。消息通知系统是一个比较复杂的系统,这里主要分析站内消息如何设计和实现。 我们常见的消息推送渠道有以下几种: 设备推送 站内推送 短信推送 邮箱推送 我们常见的站内通知有以下几种类别: 公告 Announcement ...
分类:
其他好文 时间:
2020-07-15 13:04:25
阅读次数:
72
sklearn实践(一):kmeans聚类 实践往往比理论要经历更多的挫折。 一、数据处理 官方给的案例里用的都是sklearn自带的数据集,只要import之后便万事大吉,但实际中我们采用的数据往往没有那么规整,也不是可以一下就fit到模型里去的。经过这次经历,打算整理一下大致思路,关于更高级、深 ...
分类:
其他好文 时间:
2020-07-12 11:56:48
阅读次数:
59
[HTML 中文开发手册option (Elements) - HTML 中文开发手册在web表单中,HTML元素用于定义在,或元素中包含的项。 可以在弹出窗口和 html 文档中的其他项目列表中表示菜单项。内容类别无允许的内容带有最终转义字符(例如 é)的文本标记省略开始标记是必需的。如果此元素紧... ...
分类:
Web程序 时间:
2020-07-12 09:12:13
阅读次数:
133
1. 分析为什么平方损失函数不适用于分类问题. 分类问题中的标签,是没有连续的概念的。每个标签之间的距离也是没有实际意义的,所以预测值 和 标签两个向量之间的平方差这个值不能反应分类这个问题的优化程度。 假设分类问题的类别是1,2,3 那么对于一个真实类别为2的样本X,模型的分类结果是 1 或 3, ...
分类:
其他好文 时间:
2020-07-11 22:38:55
阅读次数:
159
先说结论,贝叶斯分类=最大化后验概率。 给定样本$x$和所属类别$c$,贝叶斯最优分类器欲最大化后验概率$P(c|x)$。想实现这个目的可以通过判别模型(如决策树、支持向量机等,直接对后验概率建模),或生成模型(对联合概率$P(x,c)$建模)。 对于生成模型,考虑: \[ P(c|x)=\frac ...
分类:
其他好文 时间:
2020-07-11 20:54:58
阅读次数:
68
一、概述 k-近邻算法(k-Nearest Neighbour algorithm),又称为KNN算法,是数据挖掘技术中原理最简单的算法。KNN 的工作原理:给定一个已知标签类别的训练数据集,输入没有标签的新数据后,在训练数据集中找到与新数据最邻 近的k个实例,如果这k个实例的多数属于某个类别,那么 ...
分类:
编程语言 时间:
2020-07-11 17:13:58
阅读次数:
54