码迷,mamicode.com
首页 >  
搜索关键字:大数据 sqoop 数据处理    ( 17411个结果
大数据分析:微信推文爬取与分析(词频词云分析)
首先先对《叮咚!院“十佳”优秀经管青年组团出道,快来打call~》这篇微信文章分析,查看网页源代码可以发现,整篇文章的文字部分以层次关系分别在<div id = “js_article”> --> <div class = “rich_media_inner”> --> <div id = “pag ...
分类:微信   时间:2020-07-04 16:57:55    阅读次数:174
RabbitMQ简介
如果从消息组件来讲主要划分为两类: JMS组件:ActiveMQ(慢) AMQP组件(协议):性能是最高的,而AMQP有两个主要的开源项目: |-RabbitMQ:使用最为广泛,速度也很快 |-Kafka:是在大数据时代产生的,未来明日之星。 RabbitMQ系统架构在所有的消息系统之中,其基本由生 ...
分类:其他好文   时间:2020-07-04 16:53:00    阅读次数:71
Stream API
Stream API 为了说一下 Stream API 的使用,可以说是大费周章啊,知其然,也要知其所以然吗,追求技术的态度和姿势要正确。 当然 Stream 也不只是 Lambda 表达式就厉害了,真正厉害的还是它的功能,Stream 是 Java 8 中集合数据处理的利器,很多本来复杂、需要写很 ...
分类:Windows程序   时间:2020-07-04 15:00:49    阅读次数:52
Redis五大数据类型(未完)
redis五大数据类型 翻译: Redis是一种开放源代码(BSD许可)的内存中数据结构存储,用作数据库,缓存和消息代理。它支持数据结构,例如字符串,哈希,列表,集合,带范围查询的排序集合,位图,超级日志,带有半径查询和流的地理空间索引。Redis具有内置的复制,Lua脚本,LRU驱逐,事务和不同级 ...
分类:其他好文   时间:2020-07-04 13:46:51    阅读次数:80
12款最好用的数据挖掘工具
数据在当今世界意味着金钱。随着向基于app的世界的过渡,数据呈指数增长。然而,大多数数据是非结构化的,因此需要一个过程和方法从数据中提取有用的信息,并将其转换为可理解的和可用的形式。数据挖掘或“数据库中的知识发现”是通过人工智能、机器学习、统计和数据库系统发现大数据集中的模式的过程。免费的数据挖掘工具包括从完整的模型开发环境如Knime和Orange,到各种用Java、c++编写的库,最常见的是P
分类:其他好文   时间:2020-07-04 09:12:57    阅读次数:975
Python正则(Re模块)
正则 一,简介/动机 1.1 正则的出现动机 ? 我们在学习python的路途上,有许多需要操作文本数据的场景。无论是前后端/数据库都需要处理文本数据。处理文本时候,正则表达式给我们提供了强大的搜索,匹配,抽取,替换等功能。 1.2 什么是正则表达式(regex) ? 正则表达式由一些字符和特殊符号 ...
分类:编程语言   时间:2020-07-03 23:23:44    阅读次数:83
cehsi
一、基本概念 大数据也称之为LOB(Large Objects),LOB又分为:clob和blob,clob用于存储大文本,blob用于存储二进制数据,例如图像、声音、二进制文等。 在实际开发中,有时是需要用程序把大文本或二进制数据直接保存到数据库中进行储存的。 对MySQL而言只有blob,而没有 ...
分类:其他好文   时间:2020-07-03 23:11:05    阅读次数:72
如何决策快人一步? 用一块大屏轻松实现数据可视化
大数据时代,我们最常听到的一句话就是“用数据说话”。但数据本身都是冰冷的数字,它很难直接告诉我们哪些数据是有价值的信息。只有通过合适的可视化工具来进行数据的展示表达,才可以使传递给使用者的感受更加直观,也更容易获得其中价值。 数据大屏就是一种非常流行的数据可视化工具,它可以将业务的关键指标以可视化的 ...
分类:其他好文   时间:2020-07-03 21:39:58    阅读次数:73
机器学习融合想法记录(未完成版)
## **文档说明**本文档主要记录模型融合的有关问题:为了使项目在模型预测有更好的表现,综合机器学习方面的模型融合技术,以提升算法在解决问题的能力。 ## **使用背景** 业务情节:接单阶段; 时间段:2020 数据量:160W 特征数(本篇不对特征处理做说明):20 ## **数据处理**综合 ...
分类:其他好文   时间:2020-07-03 19:51:48    阅读次数:68
pandas,对dataFrame中某一个列的数据进行处理
背景:dataFrame的数据,想对某一个列做逻辑处理,生成新的列,或覆盖原有列的值 下面例子中的df均为pandas.DataFrame()的数据 1、增加新列,或更改某列的值 df["列名"]=值 如果值为固定的一个值,则dataFrame中该列所有值均为这个数据 2、处理某列 df["列名"] ...
分类:其他好文   时间:2020-07-03 19:39:59    阅读次数:299
17411条   上一页 1 ... 70 71 72 73 74 ... 1742 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!