有两种类型的转换是可用的:分位数转换和幂函数转换。分位数和幂变换都基于特征的单调变换,从而保持了每个特征值的秩。 通过执行秩变换,分位数变换平滑了异常分布,并且比缩放方法受异常值的影响更小。但是它的确使特征间及特征内的关联和距离失真了。 幂变换则是一组参数变换,其目的是将数据从任意分布映射到接近高斯 ...
分类:
其他好文 时间:
2021-06-19 19:31:43
阅读次数:
0
线性回归 房价预测 跟着李沐的动手学深度学习,跟着写了一遍房价预测的处理和预测,加了一些注释,同时稍微改动了一些地方 import hashlib import os import tarfile import zipfile import requests DATA_HUB = dict() DA ...
分类:
其他好文 时间:
2021-06-19 18:54:00
阅读次数:
0
简介: 最佳实践,以DLA为例子。DLA致力于帮助客户构建低成本、简单易用、弹性的数据平台,比传统Hadoop至少节约50%的成本。其中DLA Meta支持云上15+种数据数据源(OSS、HDFS、DB、DW)的统一视图,引入多租户、元数据发现,追求边际成本为0,免费提供使用。DLA Lakehou ...
分类:
其他好文 时间:
2021-06-18 20:06:29
阅读次数:
0
from pyspark.ml.linalg import Vector,Vectorsfrom pyspark.sql import Row,functionsfrom pyspark.ml.evaluation import MulticlassClassificationEvaluatorfr ...
分类:
其他好文 时间:
2021-06-16 18:19:18
阅读次数:
0
1 Hoeffding不等式 Hoeffding不等式是非常有用的一个不等式,在机器学习、统计学等领域,都发挥着巨大的作用。 它的思想与Markov不等式有些类似,我们先给出它的形式: Hoeffding不等式:$Y_1,\ldots,Y_n$为独立观测,\(E(Y_i)=0\),\(a_i\leq ...
分类:
其他好文 时间:
2021-06-15 17:41:59
阅读次数:
0
56层只要把前20层参数河这个20层的参数一样,后面36层就什么都不做,只复制前一层的输出就好;所以56层一定可以做大20层的network做的事情;56层比20层的弹性更大,多以没有道理做的没有20层的好。所以此处不是overfitting,也不是model bias,因为56层network弹性 ...
分类:
其他好文 时间:
2021-06-13 10:19:25
阅读次数:
0
师兄的博客,毕业了他没维护了,我转过来。原文地址 "https://blog.csdn.net/LogHouse/article/details/90550608" @ "TOC" 基础知识至线性回归 从头学习周志华版的机器学习,同时准备使用Python实现一些相关的方法,以 ...
分类:
其他好文 时间:
2021-06-11 17:37:36
阅读次数:
0
师兄博客原文地址 "https://blog.csdn.net/LogHouse/article/details/90734048" @ "TOC" 线性模型及多分类 承接上一篇,线性模型的部分内容已经讲过了,这篇主要讲剩下的内容,对应周志华《机器学习》第三章的大部分。 一些 ...
分类:
其他好文 时间:
2021-06-11 17:34:08
阅读次数:
0
师兄博客原文地址 "https://blog.csdn.net/LogHouse/article/details/92405509" @ "TOC" 对应西瓜书第4章内容。 一些问题 1、决策树学习算法包括哪几个部分?常用的算法有哪些? : 决策树算法过程主要包括: ①划分选择; ②树的生成; ③剪 ...
分类:
其他好文 时间:
2021-06-11 17:33:53
阅读次数:
0
师兄博客原文地址 "https://blog.csdn.net/LogHouse/article/details/93222454" ,这篇感觉他还没写完。有时间我补一下 @ "TOC" 对应周志华西瓜书第五章。 一些问题 1、试述常见的激活函数,试述将线性函数用作神经元激活函数的缺陷。 : ①阶跃 ...
分类:
其他好文 时间:
2021-06-11 17:33:23
阅读次数:
0