原文: https://www.toutiao.com/i6764683672772674062/ 在进入Map之前,首先会将数据从HDFS中读取,进行处理,按照字节偏移量这种之前说的形式处理为K,V对的形式,进入Map阶段。 其中InputFormat可以认为是一种类的继承关系,最终通过调用rea ...
分类:
其他好文 时间:
2020-03-20 00:45:41
阅读次数:
69
今天完成了根据项目完成单位通过高德地图api进行查询项目的省市县以及行政区号,下面是遇到的几点问题: 1有些项目完成单位在高德地图上是查不到的,,,也不是查不到,会显示该地没有核实。通过api是查不到相关信息的,,,,这点有点难受。 2高德地图给普通开发者的配额数量是有限的,因为写代码时候尝试的有点 ...
分类:
其他好文 时间:
2020-03-13 01:47:53
阅读次数:
96
在工作中因为区号和手机号没区分处理为了拆分中间加了个@符号,当需要展示的时候需要把@符号去掉,这里用的是一个过滤器: indexOf()方法返回调用它的字符串对象中第一次出现指定值的索引,如果未找到该值,则返回 1 replace()方法返回一个由替换值替换一些或所有匹配后的新字符串 或者是在获得数 ...
分类:
移动开发 时间:
2020-02-29 15:08:19
阅读次数:
198
从剪贴板中查找美国电话号码和电子邮件,并在屏幕打印。 import re import pyperclip #为电话创建正则表达式 phoneRegex = re.compile(r'''( (\d{3}|\(\d{3}\))? #区号 (\s|-|\.)? #分隔符 (\d{3}) #前三位 (\ ...
分类:
其他好文 时间:
2020-02-24 10:07:16
阅读次数:
87
主题Topic通常,主题是指某些特定的相互关联的概念的特定标题或名称。 在Kafka中,主题一词是指用于存储和发布特定数据流的类别或通用名称。 基本上,Kafka中的主题类似于数据库中的表table,但不包含所有约束。 在Kafka中,我们可以根据需要创建n个主题。 它由其名称标识,这取决于用户的选 ...
分类:
Web程序 时间:
2020-01-11 15:27:24
阅读次数:
102
public class SubStringTest { @Test public void test() { String s = "北京市丰台区东铁营街道政馨园社区1区1号楼1层"; System.out.println(subString(s, 58)); } public static St... ...
分类:
编程语言 时间:
2020-01-10 01:15:19
阅读次数:
110
关于硬盘: 磁头在读写数据时,并不接触盘面,而是悬浮在距离盘面表面非常近的地方。如果因为某些原因,磁头接触到了盘面,会产生破坏性的后果。 硬盘分区: 硬盘一般分为IDE硬盘、SCSI硬盘和SATA硬盘。在Linux中,IDE借口的设备被称为hd,SCSI和SATA接口的设备则被称为sd。第一块 硬盘 ...
分类:
系统相关 时间:
2019-12-27 00:10:21
阅读次数:
133
rowKey设计原则 1、长度原则 最大值为64KB, 长度在10 ~ 100byte ; 最好是 8 的倍数,太长会影响性能; 2、唯一原则 具有唯一性; 3、散列原则 1)、盐值散列;不能使用时间戳作为rowKey; 2)、 字符串反转:131313131 3)、计算分区号: hashmap ...
分类:
其他好文 时间:
2019-12-07 14:49:21
阅读次数:
156
磁盘 Linux的磁盘类型有IDE和SCSI两种。 IDE的命名方式是采用/dev/hdx(x代表磁盘块),其下的分区则是/dev/hdxy(y代表该磁盘上的分区号) SCSI则是采用/dev/sdx,其下的分区则是/dev/sdxy fdisk -l /dev/磁盘块 ,没有查看到创建的任何分区, ...
分类:
系统相关 时间:
2019-11-24 13:57:51
阅读次数:
92
常用的正则表达式 python 非负整数:^\d+$ 正整数:^[0 9] [1 9][0 9] $ 非正整数:^(( \d+)|(0+))$ 负整数:^ [0 9] [1 9][0 9] $ 整数:^ ?\d+$ 非负浮点数:^\d+(\.\d+)?$ 正浮点数 : ^((0 9)+\.[0 9] ...
分类:
其他好文 时间:
2019-11-03 10:43:59
阅读次数:
68