主要从三方面介绍Hadoop数据管理:分布式文件系统HDFS、分部式数据库HBase和数据仓库工具Hive ...
分类:
其他好文 时间:
2018-03-14 15:52:57
阅读次数:
192
工作中遇到js数组排序问题,数组中存储的都是对象,于是就百度了下,利用别人的代码进行修改,最终完成可以倒序、反序,可以进行多维度排序的功能源码如下: 使用示例: 来源:jsfun.cn ...
分类:
编程语言 时间:
2018-03-10 20:31:24
阅读次数:
174
分布式系统实践 1. Apache下流处理项目巡览 https://mp.weixin.qq.com/s/HCKpLP0bvuBNWaQFQWLp0g 摘要: 最近几年,数据的生成、消费、处理以及分析的速度惊人地增长,社交媒体、物联网、游戏等领域产生的数据都需要以接近实时的速度处理和分析数据。这直接 ...
分类:
其他好文 时间:
2018-02-14 13:51:00
阅读次数:
160
满屏尽是字母和数字,不直观,难以理解。通过提供数据接口服务 Web API(SOAP 或 Restful),以支持可视化图表或界面,实现 观测:直观的多维度数据信息展示 跟踪:挖掘和分析数据背后的隐藏价值 预测:大数据的核心(事物发展规律) 推荐几款实用工具 BDP个人版 Tableau Softw ...
分类:
其他好文 时间:
2018-02-12 18:33:59
阅读次数:
158
————传送:洛谷P2530 这道题目还是挺简单的,状态也容易想到。 数据范围非常的小,所以即便是很多维度,复杂度也完全可以接受。定义状态:dp[i][a][b][c]为手上的货物拿到第i个时三种物品分别有a, b, c个所用的最少次数。 状态转移就暴力枚举是放下a,b,c中的哪一个。 只不过需要特 ...
分类:
其他好文 时间:
2018-02-03 15:47:02
阅读次数:
105
为什么用到ELK: 一般我们需要进行日志分析场景:直接在日志文件中 grep、awk 就可以获得自己想要的信息。但在规模较大的场景中,此方法效率低下,面临问题包括日志量太大如何归档、文本搜索太慢怎么办、如何多维度查询。需要集中化的日志管理,所有服务器上的日志收集汇总。常见解决思路是建立集中式日志收集 ...
分类:
其他好文 时间:
2018-01-31 11:39:13
阅读次数:
143
实时计算部分参考自博文: 1. "实时用户标签生成系统设计" 用户标签系统的用途 用户分类,精准营销。 标签的定义 我司常用的标签有:新用户、老用户、流失用户、活跃用户等。此外,还可以根据用户以往行为,如投诉、订单取消、查看报价等,为用户打上相应的标签。标签系统提供了从多维度进行用户分类的方法 。在 ...
分类:
其他好文 时间:
2018-01-29 21:33:44
阅读次数:
250
原文:C#设计模式之十二代理模式(Proxy Pattern)【结构型】一、引言 今天我们要讲【结构型】设计模式的第七个模式,也是“结构型”设计模式中的最后一个模式,该模式是【代理模式】,英文名称是:Proxy Pattern。还是老套路,先从名字上来看看。“代理”可以理解为“代替”,代替“主人”做... ...
本篇博文是数据挖掘部分的首篇,思路主要是先聊聊相似度的理论部分,下一篇是代码实战。 我们在比较事物时,往往会用到“不同”,“一样”,“相似”等词语,这些词语背后都涉及到一个动作——双方的比较。只有通过比较才能得出结论,究竟是相同还是不同。但是万物真的有这么极端的区分吗?在我看来不是的,生活中通过“相 ...
分类:
其他好文 时间:
2018-01-14 16:42:35
阅读次数:
1523
真正的践行者,一定是工匠精神的受益者,用修行的价值观代替浮躁功利的工作观。用一生为代价去做一件事情,那是一种纯粹的伟大。 本文作者:i春秋签约作家——夏之冰雪 今年初写的一篇文章,漏洞根源在于人——知识深度篇 ,本来是写系列文章,因为各种个人原因一直推迟了。收拾好心情,重新出发吧! 我们在安全检测、 ...
分类:
其他好文 时间:
2017-12-13 19:52:31
阅读次数:
153