码迷,mamicode.com
首页 > 其他好文 > 详细

Hadoop

时间:2019-10-22 10:32:44      阅读:108      评论:0      收藏:0      [点我收藏+]

标签:问题   ola   算法   处理   lap   平台   并行处理   pagerank   hadoop   

Hadoop:
大数据集群,只能运行在Linux平台
RDBMS:表
字段、数据类型、约束
结构化数据
关系数据库在数据中占据重要的地位
但不是所有的数据都可以结构化
结构化数据:structured data
非结构化数据:unstructured data
半结构化数据:semi-structured data
通常保存为xml , json
Google:pagerank 页面算法
化整为零,并行处理
将一个大问题切割成多个小问题
OLAP:数据挖掘
机器学习:deep learning
多节点并行处理

Map reduce:
函数式编程API
运行框架

Hadoop

标签:问题   ola   算法   处理   lap   平台   并行处理   pagerank   hadoop   

原文地址:https://blog.51cto.com/14087650/2444340

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!