首页 > 其他好文 > 详细

Github 1.9K Star的数据治理框架-Amundsen

时间：2021-03-26 15:12:41 阅读：0 评论：0 收藏：0 [点我收藏+]

标签：arc 完成 mysq release 项目 web应用 ase 有关 bapi

技术图片

Amundsen的使命，整理有关数据的所有信息，并使其具有普遍适用性。

这是Amundsen官网的一句话，对于元数据的管理工作，复杂且繁琐。可用的工具很多各有千秋，数据血缘做的较好的应该是Apache Atlas，而数据可视化做的较好的应该是Apache Superset。业界一直需要一个可以整合这些功能，让数据治理更加的简单便捷，而这正是Amundsen的使命。

类似于Atlas (Apache)，Datahub (LinkedIn)。Amundsen主要在于提高数据分析师，数据科学家和数据工程师的工作效率。它可以通过为数据资源建立索引，并通过一定的机制来支持在页面上进行排名搜索。可以将其视为搜索功能，但搜索的是元数据。该项目以挪威探险家Roald Amundsen（第一个发现南极的人）的名字命名。

Amundsen由LF AI＆Data基金会维护。LF AI＆Data是Linux Foundation的保护基金会，支持人工智能，机器学习，深度学习和数据方面的开源创新。

技术图片

目前Amundsen在github有1.9kStar，还没有Releases的版本，项目正处于蒸蒸日上的上升期。

技术图片

架构

下图显示了Amundsen的总体架构。

技术图片

可见，Hive，Presto等数据源通过Databuilder ingestion框架获取元数据，写入Elasticsearch和Neo4j，通过搜索服务与元数据服务提供给前端。

主要模块如下：

前端服务

作为用户交互的web页面。

这是基于Flask的Web应用程序，页面是React构建的。

搜索服务

搜索服务采用Elasticsearch的搜索功能（或者Apache Atlas），并提供一个RESTful API服务。

元数据服务

元数据服务目前使用的Neo4j的图数据库进行交互。

功能展示

Amundsen提供了搜索，推荐，表描述，数据预览在内的非常多的功能，数据血缘功能正在研发中。

以上是部分功能展示：

登陆页面：Amundsen的登陆页面

技术图片

搜索预览：查看搜索结果

技术图片

表的详细页面：Hive 等表的可视化

技术图片

列详细信息：主要是一些列的统计信息

技术图片

数据预览页面：表数据预览的可视化，可以与Apache Superset或其他数据可视化工具集成。

技术图片

集成

Amundsen支持的数据源非常多。

Apache Druid，Apache Hive，CSV，Oracle，

Mysql，Delta Lake等等。

Amundsen还可以连接到任何提供dbapi或sql_alchemy接口的数据库。

同时Amundsen还支持和一些仪表盘的集成，比如

Redash，Tableau。

ETL工具的集成，Apache Airflow。

BI可视化工具，Apache Superset。

未来规划

作为数据治理领域的未来之星，Amundsen有着非常好的计划。

2021年愿景

可以和所有的数据源进行集成，解决越来越多的数据治理问题。

近期工作重点

数据血缘（设计完成）

集成数据质量系统（进行中）

列值过滤（已开始）

搜索结果层次结构（计划中）

当然，还有很多计划中的功能，这里不一一列举。

期待未来Amundsen的发展，我们也将对其新版本与新功能的发布持续关注！

Github 1.9K Star的数据治理框架-Amundsen

标签：arc 完成 mysq release 项目 web应用 ase 有关 bapi

原文地址：https://www.cnblogs.com/tree1123/p/14570240.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！