标签:多源 画像 整合 type 维数 分布 数据导出 api hba
1、清晰的可探索的目标:
a、定义对搜索引擎内数据的清洗转入规则
b、定义搜索引擎内数据的元数据描述规格
c、实现个人画像基本信息查询、个人画像事实信息查询的api
d、支持用户群查询(标签的组合条件查询)的api:基于元数据的类SQL
e、支持用户动态标签的加入和元数据注册:单独建立es的type存储和更新
2、不是很清晰的目标:
f、实现用户疑似关系数据的加入和元数据注册?
g、如何对各类关系设置权重?
3、当前目标和阿里云的差异:
a、阿里云是多源数据整合,大数据算法框架接收,入多维数据库,基于多维库的分析能力提供。
其中,
多源数据整合:多个来源的数据表组合大宽表、数据抽取能力(手工、定时)
大数据算法:基于规则的数据路由(分布式?)
基于多维库的分析能力提供:数据导出、查询转化api提供、sdk化的嵌入界面能力提供
b、目前我们做的可能只是在做搜索展现前端的逻辑抽取展现
后续随着算法要求和查询要求,可能会按需引入大数据计算框架、多维库和hbase库、关系库,
以方便计算和查询
标签:多源 画像 整合 type 维数 分布 数据导出 api hba
原文地址:http://www.cnblogs.com/lexiaofei/p/6641085.html