码迷,mamicode.com
首页 >  
搜索关键字:数据采集    ( 1158个结果
elasticsearch 结合 flink,kafka 性能调优经验
1. 产品的架构是数据采集到 kafka,由 flink 读取,送入ES 2. 这个过程中,涉及: kafka分区数,flink并行度,ES 分区数和副本 3. kafka 分区数决定了后面 flink 的并行度,最好是 kafka 的分区数和 flink 的并行度一致 4. 写入 ES 时,需要先 ...
分类:其他好文   时间:2020-11-16 14:01:57    阅读次数:18
分布式日志收集器 - Flume
Flume概述官方文档:https://flume.apache.org/documentation.htmlFlume是一种分布式、高可靠和高可用的日志数据采集服务,可高效地收集、聚合和移动大量日志数据。它具有一种基于流数据的简单且灵活的体系结构。它具有健壮性和容错性,具有可调整的可靠性机制和许多故障切换和恢复机制。它使用一个简单的可扩展数据模型,允许在线分析应用程序。Flume架构及核心组件F
分类:Web程序   时间:2020-11-08 16:36:50    阅读次数:26
抖音直播监控Api:在线观众
TiToData:专业的短视频数据采集、处理平台。 更多信息请联系: TiToData 海量数据采集 每天为客户采集5亿条数据 覆盖主流平台:TikTok,Zynn,YouTube,抖音,快手,1688,小红书,拼多多,淘宝,美团,饿了么,淘宝,微博 请求Api http://主机地址/douyin ...
分类:Windows程序   时间:2020-11-07 17:12:39    阅读次数:94
毕业设计之 --- 新闻分类系统
简介新闻分类课题是在算法类毕业设计中比较热门的,本质上是属于自然语言分类,可以使用机器学习算法去处理,也可以使用深度学习算法去处理.基本步骤如下:文本数据采集-->选择训练算法(机器学习/深度学习)-->进行训练-->检效果.本文章博主将介绍:从头开始实践中文短文本分类运用多种机器学习(深度学习+传统机器学习)方法比较短文本分类处理过程与结果差别参与及比较算法使用下面的算法来进行
分类:其他好文   时间:2020-11-06 02:24:54    阅读次数:21
毕业设计之 --- 新闻分类系统
简介新闻分类课题是在算法类毕业设计中比较热门的,本质上是属于自然语言分类,可以使用机器学习算法去处理,也可以使用深度学习算法去处理.基本步骤如下:文本数据采集-->选择训练算法(机器学习/深度学习)-->进行训练-->检效果.本文章博主将介绍:从头开始实践中文短文本分类运用多种机器学习(深度学习+传统机器学习)方法比较短文本分类处理过程与结果差别参与及比较算法使用下面的算法来进行
分类:其他好文   时间:2020-11-06 02:24:42    阅读次数:22
APM时代的质量保障之路:腾讯互娱品质管理部性能负责人访谈
APM时代的质量保障之路:腾讯互娱品质管理部性能负责人访谈导读:11月23~24日,GIAC全球互联网架构大会将于上海举行。GIAC是高可用架构技术社区推出的面向架构师、技术负责人及高端技术从业人员的技术架构大会。今年的GIAC已经有微软,腾讯、阿里巴巴、蚂蚁金服,华为,科大讯飞、新浪微博、京东、七牛、美团点评、饿了么,才云,格灵深瞳,Databricks,等公司专家出席。本周购买可享门票88折优
分类:其他好文   时间:2020-11-06 00:53:01    阅读次数:16
转发-联通运营商大数据和智能外呼机器人
各种线下线上的联通运营商大数据采集主要分为三类:通过典型场景安置代码及科技采集器采集数据、广范围地抓取数据、通过API接口同各种系统或第三方系统导入数据。 典型场景安置代码及科技采集器采集数据:线上的联通运营商大数据采集主要是在网页中安置三网大数据获客系统Java代码或在App中安置SDK或通过AP ...
分类:移动开发   时间:2020-11-04 19:06:55    阅读次数:29
HTTP代理和IP代理的区别
从事互联网工作,HTTP代理和IP代理相信都很熟悉。因为在大家工作的时候,一些领域或者功能需要通过代理软件来完成。虽然这个软件不是一定要使用,但是如果不用不仅会让工作效率变低,爬虫工作者在数据采集的时候时候还会有非常大的几率IP被封。使用http避免ip封禁提升工作效率。IPIDEA分布国内外240+国家地区地址,支持api提取,可满足分布式爬虫使用需要。HTTP代理和IP代理的功能有着相同之处,
分类:Web程序   时间:2020-11-02 09:49:41    阅读次数:30
抖音视频Api:达人信息
TiToData,专业的短视频数据采集、处理平台。 更多信息请联系: TiToData 海量数据采集 每天为客户采集5亿条数据 覆盖主流平台:TikTok,Zynn,YouTube,抖音,快手,1688,小红书,拼多多,淘宝,美团,饿了么,淘宝,微博 接口 达人信息 参数 参数 类型 说明 toke ...
分类:Windows程序   时间:2020-10-27 11:43:19    阅读次数:47
485转4G
485转4G 485转4G 是一种可以将RS232/485采集的数据通过3G/4G发送到云端服务器进行数据交互的传输设备。实现串口设备的无线长距离数据传输,进而实现远程数据通信管理,主要应用在远程数据采集和远程控制项目 卓岚的485转4G 分为2种类型: (1)、普通4G DTU 卓岚普通4G DT ...
分类:其他好文   时间:2020-10-27 11:31:47    阅读次数:24
1158条   上一页 1 2 3 4 5 6 ... 116 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!