一、回顾 1、hive基于Hadoop的(存储HDFS,计算MR) 2、sql on hadoop概念 -》简化开发的操作 -》提升业务的效率 3、描述表的三种方式 desc tb_name; desc extended tb_name; desc formatted tb_name; 4、hive ...
分类:
其他好文 时间:
2018-07-25 14:29:16
阅读次数:
156
转自 https://blog.csdn.net/love1code/article/details/47276683 python中的del用法比较特殊,新手学习往往产生误解,弄清del的用法,可以帮助深入理解python的内存方面的问题。 python的del不同于C的free和C++的dele ...
分类:
编程语言 时间:
2018-07-23 22:04:40
阅读次数:
186
1.什么是爬虫? 请求网站并提取数据的自动化程序 请求:客户端向服务端发送请求获得网页资源,是一段html代码,包含html标签和一段信息。 提取:提取出想要的信息,然后将结构化的数据存储到文本 自动化:写完程序一直运行着,代替客户端向服务端发送请求,可以大量的获得数据 爬虫四部 1.发起请求:通过 ...
分类:
其他好文 时间:
2018-07-21 19:49:40
阅读次数:
176
1.安装好前期必备的库 - requests 向网页发出请求 解释器自带的urllib 和re selenium 用于向有js渲染的网页发起请求 from selenium import webdriver driver = webdriver.Chrome() # 生成一个driver对象,并打开 ...
分类:
数据库 时间:
2018-07-21 17:00:26
阅读次数:
310
30岁的小曹,20岁的身体,还在坚持在能力允许控制范围内22点睡觉,5点起床锻炼身体,好好学习,除了加班或者像今天这样的深夜,再一次写已经有X百万人写过的 spring Ioc 的总结博客。 一、IOC 控制反转详解: 1).传统非spring管理时候的对象间调用依赖: 我们都知道,随便一本破框架的 ...
分类:
编程语言 时间:
2018-07-01 01:06:27
阅读次数:
200
数据库分为两类:1.关系型数据库: MySQL,Oracle,sql server,db2,sqlite 需要sql语句 数据存在磁盘上2.非关系型数据库:mongodb, redis 没有表结构 没有sql语句 使用get('k'),set('xx')说明:1.redis数据全部存在内存里面 2. ...
分类:
数据库 时间:
2018-06-16 19:34:29
阅读次数:
196
import pymysql #导入pymysql模块coon=pymysql.connect( #连接数据库 host='192.168.13.4',user='abc',passwd='123456', #host为数据库的ip port=3306,db='abc',charset='utf8' ...
分类:
数据库 时间:
2018-06-16 17:52:32
阅读次数:
151
由于MD5模块在python3中被移除 在python3中使用hashlib模块进行md5操作import hashlibm=hashlib.md5() #创建MD5对象passwd='aaa123' #待加密密码m.update(passwd.encode()) #不能直接对字符串加密,要先把字符 ...
分类:
编程语言 时间:
2018-06-16 17:05:06
阅读次数:
198