概念剖析 kafka的两种位移 关于位移(Offset),其实在kafka的世界里有两种位移: 分区位移:生产者向分区写入消息,每条消息在分区中的位置信息由一个叫offset的数据来表征。假设一个生产者向一个空分区写入了 10 条消息,那么这 10 条消息的位移依次是 0、1、…、9; 消费位移:消 ...
分类:
其他好文 时间:
2020-06-20 13:33:55
阅读次数:
60
时间限制:10000ms 单点时限:1000ms 内存限制:256MB 题目的大概意思就是 史蒂文·爱在手机上读书。 他现在阅读的书包含N个段落,第i个段落包含ai字符。史蒂文想使字符更易于阅读,因此他决定增加字符的字体大小。 但史蒂文(Steven)的手机屏幕尺寸有限。 其宽度为W,高度为H。因此 ...
分类:
其他好文 时间:
2020-06-19 18:09:12
阅读次数:
56
FileOutputStream fos = new FileOutputStream ("zzz.txt"); fos.write("我读书少,你不要骗我".getBytes()); //将字符串转换为字节数组,然后写出 fos.write("\r\n"getBytes()); //换到下一行 f ...
分类:
其他好文 时间:
2020-06-17 23:43:58
阅读次数:
60
1、引入 聚焦爬虫:在通用爬虫的基础之上,可以将一张页面中局部指定的数据进行爬取。可以通过数据解析的方式将一张页面中局部的数据进行解析或者提取。 数据解析方式: 正则 bs4 xpath(重点) pyquery 聚焦爬虫编码流程: 指定url 发起请求 获取响应数据 数据解析 持久化存储 2、数据解 ...
分类:
编程语言 时间:
2020-06-17 23:03:38
阅读次数:
74
默认方式:先入先出,消息被追加写入每个分区的尾部 分区:可以在不同的服务器上,也就是说,一个主题可以横跨多个服务器 我们吧一个主题的数据看成一个流,不管分多少区,流就是一组从生产者移动到消费者 一个kafka服务器被称为broker,一个broker可以轻松处理数千个分区一级美妙百万级的消息量 保留 ...
分类:
其他好文 时间:
2020-06-15 10:14:47
阅读次数:
57
有些小说作者,写小说的时候喜欢引用一些古诗词。当时看着挺爽的,回头想仔细看看那些诗。但是没有那么多闲心去重新看一遍。 因此用python写个脚本统计一下文中的七字绝句。 #!/usr/bin/python import re f = open("msj.txt") line = f.readline ...
分类:
其他好文 时间:
2020-06-14 17:04:59
阅读次数:
76
(1)实战背景 小说网站-笔趣看: URL:http://www.biqukan.com/ 笔趣看是一个盗版小说网站,这里有很多起点中文网的小说,该网站小说的更新速度稍滞后于起点中文网正版小说的更新速度。并且该网站只支持在线浏览,不支持小说打包下载。因此,本次实战就是从该网站爬取并保存一本名为《一念 ...
分类:
编程语言 时间:
2020-06-14 13:03:15
阅读次数:
66
熵权法 熵值法的主要目的是对指标体系进行赋权 熵越大说明系统越混乱,携带的信息越少,权重越小;熵越小说明系统越有序,携带的信息越多,权重越大。 熵值法是一种客观赋权方法,,借鉴了信息熵思想,它通过计算指标的信息熵,根据指标的相对变化程度对系统整体的影响来决定指标的权重,即根据各个指标标志值的差异程度 ...
分类:
其他好文 时间:
2020-06-12 12:33:14
阅读次数:
234
用户需求: 英语的26 个字母的频率在一本小说中是如何分布的? 某类型文章中常出现的单词是什么? 某作家最常用的词汇是什么? 《哈利波特》 中最常用的短语是什么,等等。 我们就写一些程序来解决这个问题,满足一下我们的好奇心。 第0步:输出某个英文文本文件中 26 字母出现的频率,由高到低排列,并显示 ...
分类:
其他好文 时间:
2020-06-10 17:16:04
阅读次数:
61
Go语言高阶:调度器系列(1)起源 如果把语言比喻为武侠小说中的武功,如果只是会用,也就是达到四五层,如果用的熟练也就六七层,如果能见招拆招也得八九层,如果你出神入化,立于不败之地十层。 如果你想真正掌握一门语言的,怎么也得八层以上,需要你深入了解这门语言方方面面的细节。 希望以后对Go语言的掌握能 ...
分类:
编程语言 时间:
2020-06-08 14:46:01
阅读次数:
72