一、回顾 1、hive基于Hadoop的(存储HDFS,计算MR) 2、sql on hadoop概念 -》简化开发的操作 -》提升业务的效率 3、描述表的三种方式 desc tb_name; desc extended tb_name; desc formatted tb_name; 4、hive ...
分类:
其他好文 时间:
2018-07-25 14:29:16
阅读次数:
156
转自 https://blog.csdn.net/love1code/article/details/47276683 python中的del用法比较特殊,新手学习往往产生误解,弄清del的用法,可以帮助深入理解python的内存方面的问题。 python的del不同于C的free和C++的dele ...
分类:
编程语言 时间:
2018-07-23 22:04:40
阅读次数:
186
1.什么是爬虫? 请求网站并提取数据的自动化程序 请求:客户端向服务端发送请求获得网页资源,是一段html代码,包含html标签和一段信息。 提取:提取出想要的信息,然后将结构化的数据存储到文本 自动化:写完程序一直运行着,代替客户端向服务端发送请求,可以大量的获得数据 爬虫四部 1.发起请求:通过 ...
分类:
其他好文 时间:
2018-07-21 19:49:40
阅读次数:
176
1.安装好前期必备的库 - requests 向网页发出请求 解释器自带的urllib 和re selenium 用于向有js渲染的网页发起请求 from selenium import webdriver driver = webdriver.Chrome() # 生成一个driver对象,并打开 ...
分类:
数据库 时间:
2018-07-21 17:00:26
阅读次数:
310
疑惑在于 《python 程序设计(第2版) 董付国 清华大学出版社》第46页 原文是: 关键疑惑点在于最后一行代码中的 map(str.strip, freshfruit) 根据上一条随笔, map(A, B)函数是 把 B 代入 A 中 返回结果,按这个来看,那么原文应该是 把列表 freshf ...
分类:
编程语言 时间:
2018-07-13 13:22:26
阅读次数:
150
原文地址:https://www.jianshu.com/p/b2da4d94a122 一、概述 本文主要是从deep learning for nlp课程的讲义中学习、总结google word2vector的原理和词向量的训练方法。文中提到的模型结构和word2vector的代码实现并不一致,但 ...
分类:
其他好文 时间:
2018-07-12 01:00:57
阅读次数:
220
30岁的小曹,20岁的身体,还在坚持在能力允许控制范围内22点睡觉,5点起床锻炼身体,好好学习,除了加班或者像今天这样的深夜,再一次写已经有X百万人写过的 spring Ioc 的总结博客。 一、IOC 控制反转详解: 1).传统非spring管理时候的对象间调用依赖: 我们都知道,随便一本破框架的 ...
分类:
编程语言 时间:
2018-07-01 01:06:27
阅读次数:
200
数据库分为两类:1.关系型数据库: MySQL,Oracle,sql server,db2,sqlite 需要sql语句 数据存在磁盘上2.非关系型数据库:mongodb, redis 没有表结构 没有sql语句 使用get('k'),set('xx')说明:1.redis数据全部存在内存里面 2. ...
分类:
数据库 时间:
2018-06-16 19:34:29
阅读次数:
196
import pymysql #导入pymysql模块coon=pymysql.connect( #连接数据库 host='192.168.13.4',user='abc',passwd='123456', #host为数据库的ip port=3306,db='abc',charset='utf8' ...
分类:
数据库 时间:
2018-06-16 17:52:32
阅读次数:
151