zqc0512有轮子都还造轮子啊。套路不对呢。2018-08-1416:27MCTW回复zqc0512_(ω」∠)_没办法啊同学。曾经用过elasticsearch-jdbc,不是很能满足需求啊。如果字段存的是竖线分隔的标签:"金融|大数据|工作平台",希望传到es变成字符串数组["金融","大数据 ...
分类:
数据库 时间:
2020-04-17 00:45:52
阅读次数:
353
我们在学习大数据开发前需要先找到适合自己的方式方法,首先需要审视一下自身的情况,是否是以兴趣为出发点,对大数据是不是自己是真的感兴趣吗,目前对大数据的了解有多少,自己的学习能力和理解能力是否适合学习。如果是跨行业转岗是否做好了心理准备。根据不同基础水平可以分为三类: 第一类:零基础学员,对大数据行业 ...
分类:
其他好文 时间:
2020-02-09 22:08:57
阅读次数:
64
1.简述互联网信息抓取的方式。 互联网信息自动抓取,最常见且有效的方式是使用网络爬虫。 2.简述舆情系统的组成架构。 用户终端->采集层->分析层->呈现层->用户 3.中文分词算法可以分为哪几类? (1)基于字符串匹配的分词方法,它是待处理的中文字符串与一个“尽可能全面”的词典中的词条按照一定的规 ...
分类:
其他好文 时间:
2019-12-01 16:51:40
阅读次数:
265
1.数据可视化有哪些基本特征? (1)易懂性,可视化可以使碎片化的数据转换成具有特定结构的知识,从而为决策支持提供帮助。 (2)必然性,大数据所产生的数据量必然要求人们对数据进行归纳总结,对数据的结构和形式进行转换处理。 (3)片面性,数据可视化的片面性特征要求可视化模式不能替代数据本身,只能作为数 ...
分类:
其他好文 时间:
2019-12-01 15:17:12
阅读次数:
528
1.R语言是解释性语言还是编译性语言? 解释性语言 2.简述R语言的基本功能。 R语言是一套完整的数据处理、计算和制图软件系统,主要包括以下功能: (1)数据存储和处理功能,丰富的数据读取与存储能力,丰富的数据处理功能。 (2)数组运算工具 (3)完整连贯的统计分析工具 (4)优秀的统计制图功能 3 ...
分类:
编程语言 时间:
2019-12-01 09:54:27
阅读次数:
433
1.简述对用户画像的认识。 用户画像,即用户信息的标签化,是企业通过收集、分析用户数据后,抽象出的一个虚拟用户,可以认为是真实用户的虚拟代表。 2.简述构建用户画像的主要流程。 基础数据收集->行为建模->构建画像 3.个性化推荐系统的性能可以通过哪些标准来判定? 用户满意度 覆盖率 预测准确度 冷 ...
分类:
其他好文 时间:
2019-12-01 09:44:40
阅读次数:
283
spark 简介 建议先阅读我的博客 大数据基础架构 spark 一个通用的计算引擎,专门为大规模数据处理而设计,与 mapreduce 类似,不同的是,mapreduce 把中间结果 写入 hdfs,而 spark 直接写入 内存,这使得它能够实现实时计算。 spark 由 scala 语言开发, ...
分类:
其他好文 时间:
2019-10-02 12:51:02
阅读次数:
1950
一.大数据的特点 大数据是什么?其实很简单,大数据其实就是海量资料巨量资料,这些巨量资料来源于世界各地随时产生的数据,在大数据时代,任何微小的数据都可能产生不可思议的价值。大数据有4个特点,为别为:Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值),一般我们称 ...
分类:
其他好文 时间:
2019-09-21 23:38:36
阅读次数:
160
知识地图 一:大数据基础 1.三次信息化浪潮: 2.信息科技为大数据时代提供技术支撑: 存储设备容量不断增加 CPU处理能力大幅提升 网络带宽不断增加 3.数据产生方式的变革促进=成大数据时代的来临(三个阶段): 运营式系统阶段 用户原创内容阶段 感知式系统阶段 4.大数据的4个特点: 数据量大 数 ...
分类:
其他好文 时间:
2019-09-21 23:04:02
阅读次数:
237
第一步:VMware workstation网络设置第二步:虚拟机网络设置一、设置VMware Network AdapterVMnet8的IP1、打开“网络和Internet”设置选择“更改适配器选项”2、右键VMnet8点击“属性”3、找到Internet协议版本4(TCP/IPv4),再点击“ ...
分类:
其他好文 时间:
2019-09-18 10:35:10
阅读次数:
84