[TOC] 特征工程 select_dtypes 可以选择指定类型的数据 处理分类特征 pd.get_dummies() values_counts() 统计每个特征的不相同的样本个数(之和) "datacamp的栗子" isin() 结果返回一个bool型的mask 接受一个列表,判断该列中元素是 ...
分类:
其他好文 时间:
2020-03-11 12:43:54
阅读次数:
52
处理单个文件 matlab读取excel数据有一个注意的点就是路径,为方便起见可以先将matlab路径设置为要读取的excel文件的路径,这样可以不用去在函数中在写路径,然后用函数来读取, 例如 :x=xlsread(‘filename’,‘sheet1’,‘B2:B34') filename是你保 ...
分类:
其他好文 时间:
2020-03-11 11:04:24
阅读次数:
68
越来越有意思了,绕弯弯的转义符听得爽的飞起,这感觉真的很爽 re模块补充了很多内容,后期应该会很强大,但是现在就是个皮毛啊,明天这个计算器得好好整理一下思路,联系一下 一、re模块补充 import re # \ 关于转义符的补充 # 首先要明确,一个转义符要进入Python中的re模块中,需要经过 ...
分类:
编程语言 时间:
2020-03-11 00:59:20
阅读次数:
66
旅游业可以说和大数据还有互联网行业关系很密切,随着现在物质生活和思想观念的提高转变,越来越多的人开始将自己的空余时间转移到旅游上来。可以说,你在旅游中的每一个阶段都会涉及到相应的数据处理问题。前期我们肯定是要通过各种媒体来获取相应的旅游地点包括旅游路线的规划问题,在旅游中,我们也会通过不同的媒体或者平台分享自己一路的所见所感,旅游结束之后,还会有各种各样的信息反馈情况。随着互联网技术和相应手段的
分类:
其他好文 时间:
2020-03-10 23:31:04
阅读次数:
86
DataStream API Apache Flink 提供了 DataStream API 来实现稳定可靠的、有状态的流处理应用程序。 Flink 支持对状态和时间的细粒度控制,以此来实现复杂的事件驱动数据处理系统。 本文将搭建一个针对可疑信用卡交易行为的反欺诈检测系统。 例子分析 FraudDe ...
一、分布式环境的特点 分布性 分布式系统由多台计算机组成,它们在地域上是分散的,可以散布在一个单位、一个城市、一个国家,甚至全球范围内。整个系统的功能是分散在各个节点上实现的,因而分布式系统具有数据处理的分布性。 并发性 程序运行过程中,并发性操作是很常见的。比如同一个分布式系统中的多个节点,同时访 ...
分类:
其他好文 时间:
2020-03-10 15:52:35
阅读次数:
82
最近公司项目中做了一个两个oracle数据库数据进行数据实时同步的功能,由于数据量和环境的因素,开发人员采用了kafka做为消息中间件来转发数据,笔者就进行了kafka的学习,记录了下面的文档,望大家多多指教,共同学习进步。 一、 Kafka介绍 Kafka是由Java和Scala编写的是一个分布式 ...
分类:
其他好文 时间:
2020-03-09 20:58:51
阅读次数:
88
1、简介 redis是一款菲关系型数据库(Not Only SQL ),是对关系型数据库做补充。这是一种基于内存的数据库,用于应对基于海量用户和海量数据前提下的数据处理问题。 因为磁盘读/写速度比较慢的问题,一瞬间成千上万的请求到来,需要系统在极短的时间内完成成千上万次的读/写操作,极其容易造成数据 ...
分类:
其他好文 时间:
2020-03-09 17:41:34
阅读次数:
78
数据处理 处理提交数据 1. 提交的域名称和处理方法的参数名一致 2. 提交的域名称和处理方法的参数名不一致 3. 提交的是一个对象 Model、ModelMap、ModeAndView的区别 Model 只有个别方法,适合存储数据,简化 ModelMap 继承了 LinkedMap,除了实现自身方 ...
分类:
编程语言 时间:
2020-03-07 13:03:45
阅读次数:
56
消息队列和 RabbitMQ 消息队列 来看这样一个例子。相信大家都用外卖软件点过外卖。当我们在手机上下单之后,都发生了什么呢? 首先,客户用手机下单,将请求发送给服务端。服务端当然要先安排订单系统确认我们的订单信息,只有当我们付款成功后,订单才会生成。订单生成后,需要做三件事(真实的系统要做的事情 ...
分类:
其他好文 时间:
2020-03-06 21:57:18
阅读次数:
69