import matplotlib.pyplot as plt import numpy as np #数据集x,y x,y 都是向量 #给个实例x是身高(m),y是体重(kg) #我们给实际数据x,y训练出最佳的模型 y=ax+b 然后在找个身高x预测体重y x=[0.75,0.85,0.95,1 ...
分类:
编程语言 时间:
2020-11-25 12:04:23
阅读次数:
8
什么是数据中台数据中台是全新的架构变革。过去三十年,企业数据管理都以传统的IT架构为基础。每当技术部门为业务部门解决问题时,需要从业务需求的探查、技术壁垒的打通等从上到下各个方面来建设新系统。每个系统的建成都自成一体,各自满足业务部门的需求。这种情况不仅耗费各部门大量的精力也使得各个系统难以打通管理,无法形成更强大的数据能力。图片来源:国云数据此外,目前的IT辅助管理系统是以欧美国家发达的制造业为
分类:
其他好文 时间:
2020-11-23 12:29:42
阅读次数:
5
## 简单爬虫 最近参加了长风杯数据挖掘竞赛,队内分工后我选择数据获取这一项任务。 ### 1、选取目标页面 https://space.bilibili.com/546195/video ### 2、利用Element检查工具寻找需求数据 ### 3、通过搜索查找api ### 4、在termin ...
分类:
其他好文 时间:
2020-11-08 17:12:03
阅读次数:
21
机器学习平台痛点与模型提升方法:基于Spark的机器学习平台在点融网风控应用介绍编者按:大数据和机器学习是近年来快速增长的热门领域,各个领域的数据量和数据规模都以惊人的速度增长。本文是近期举行的架构实践日点融网刘利就“机器学习平台在点融网业务的应用介绍”这一话题的精彩分享。作者简介:刘利,点融网DataScientistTeam负责人,从事互联网数据分析和数据挖掘近十年。现任点融网DataScie
分类:
其他好文 时间:
2020-11-07 15:58:21
阅读次数:
20
TIOBE排行榜TIOBE排行榜是根据互联网上有经验的程序员、课程和第三方厂商的数量,并使用搜索引擎(如Google、Bing、Yahoo!)以及Wikipedia、Amazon、YouTube统计出排名数据,只是反映某个编程语言的热门程度,并不能说明一门编程语言好不好,或者一门语言所编写的代码数量多少。自20年前TIOBE指数启动以来,Java和C首次没有进入前2位。C仍然是第一但现在占据第二个
分类:
编程语言 时间:
2020-11-06 01:33:17
阅读次数:
23
APM时代的质量保障之路:腾讯互娱品质管理部性能负责人访谈导读:11月23~24日,GIAC全球互联网架构大会将于上海举行。GIAC是高可用架构技术社区推出的面向架构师、技术负责人及高端技术从业人员的技术架构大会。今年的GIAC已经有微软,腾讯、阿里巴巴、蚂蚁金服,华为,科大讯飞、新浪微博、京东、七牛、美团点评、饿了么,才云,格灵深瞳,Databricks,等公司专家出席。本周购买可享门票88折优
分类:
其他好文 时间:
2020-11-06 00:53:01
阅读次数:
16
使用pinpoint这类APM监控工具的好处,以及生产环境部署这类工具需要考虑一些因素。
分类:
其他好文 时间:
2020-11-04 18:14:11
阅读次数:
67
Scraoy入门实例一 Scrapy介绍与安装&PyCharm的安装&项目实战 一、Scrapy的安装 1.Scrapy介绍 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取 (更确切来说,网络抓 ...
分类:
Web程序 时间:
2020-11-02 10:39:55
阅读次数:
47
如果说大数据里面hive是屠龙刀,那么pandas则是倚天剑,**帮助我们对数据数据挖掘、数据分析、数据清洗**
分类:
其他好文 时间:
2020-11-01 21:11:55
阅读次数:
20
本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正。 一、分箱平滑的原理 (1)分箱方法 在分箱前,一定要先排序数据,再将它们分到等深(等宽)的箱中。 常见的有两种分箱方法:等深分箱和等宽分箱。 等深分箱:按记录数进行分箱,每箱具有相同的记录数,每箱的记录数称为箱的权重,也称箱 ...
分类:
其他好文 时间:
2020-10-31 01:54:11
阅读次数:
13