码迷,mamicode.com
首页 > 其他好文 > 详细

Hadoop

时间:2019-05-01 22:37:18      阅读:206      评论:0      收藏:0      [点我收藏+]

标签:google   red   生成   base   没有   数据   高阶函数   big   imp   

Bigdata:
结构化数据:约束
半结构化数据:
非结构化数据:没有元数据;

    搜索引擎:搜索组件、索引组件
        蜘蛛程序:

        存储:
            分析处理:

                2003年:The Google File System
                    2004年:MapReduce:Simplified Data Processing On Large Cluster
                    2006年:BigTable:A Distributed Storage System for Structure Data

                    HDFS + MapReduce = Hadoop
                    Hbase

                    Nutch

    批处理:

    函数式编程:
        Lisp, ML函数式编程语言:高阶函数;
                map, fold
                        map:
                                map(f())
                                    map:接受一个函数为参数,并将其应用于列表中的所有元素;从而生成一个结果列表
                          fold:
                                接受两个参数:函数,初始值
                                        fold(g(),init)

            mapreduce:
                mapper:
                    reducer:
                    shuffle and sort

Hadoop

标签:google   red   生成   base   没有   数据   高阶函数   big   imp   

原文地址:https://blog.51cto.com/smoke520/2388236

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!