范式化的优点:范式化更新操作通常比反范式化要快。当数据较好的范式化时,就只有很少或者没有重复数据,所以,只需要修改更少的数据。范式化的表通常更小,可以更好地放在内存里,所以执行操作会更快。很少有多余的数据意味着检索列表数据更少需要distinct或者groupby语句。范..
分类:
数据库 时间:
2017-07-22 22:22:31
阅读次数:
203
采集数据的时候,由于先期对页面结构的分析不完善,导致采漏了一部分数据。完善代码之后重新运行 Scrapy,又采集了一些重复的数据,搜了下删除重复数据的方法。 N.B. 删除数据表的重复数据时,请先备份数据表。 方法一 方法二 参考链接: ...
分类:
数据库 时间:
2017-07-20 22:08:59
阅读次数:
186
TCP是通过什么方式来提供可靠传输的 (合理截断数据包,超时重发,校验,失序重新排序,能够丢弃重复数据,TCP可以进行流量控制) TCP提供一种面向连接的、可靠的字节流服务。 面向连接:意味着两个使用TCP的应用(通常是一个客户和一个服务器)在彼此交换数据之前必须先建立一个TCP连接。在一个TCP连 ...
分类:
其他好文 时间:
2017-07-16 14:19:01
阅读次数:
226
介绍使用sql删除数据库中的重复数据1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断select * from peoplewhere peopleId in (select peopleId from people group by peopleId having co ...
分类:
其他好文 时间:
2017-07-16 09:54:11
阅读次数:
96
1:select 1.1:分组和排序 1.2:聚合函数 1.3:连接查询: union / union all union自带distance(去掉重复数据) 多个查询结果之间用union / union all 连接可以连为一个表进行输出查看 1.3.1:非等值链接 1.3.2自然连接 1)列名要 ...
分类:
其他好文 时间:
2017-07-15 16:49:30
阅读次数:
173
sql去重 现在有一张表t(id,name),id是主键,name可以重复,现在要删除重复数据,保留id最小的数据。请写出SQL。 表:t id name 1 张三 2 张三 3 李四 4 李四 5 李四 分析: 首先通过名字分组,选出每组id最小记录。然后删除这些记录以外的所有数据。 1:sele ...
分类:
数据库 时间:
2017-07-14 18:44:51
阅读次数:
278
从CREATE开始 通过显式的CREATE INDEX命令 在创建约束时作为隐含的对象 随约束创建的隐含索引 当向表中添加如下两种约束之一时,就会创建隐含索引。 一、CREATE INDEX语法 CREATE INDEX语句所做的事情与其听上去一样-用于在指定表或视图上基于声明的列创建索引: CRE ...
分类:
数据库 时间:
2017-07-13 16:35:43
阅读次数:
227
MongoDB基本使用 成功启动MongoDB后,再打开一个命令行窗口输入mongo,就可以进行数据库的一些操作。 输入help可以看到基本操作命令: show dbs:显示数据库列表 show collections:显示当前数据库中的集合(类似关系数据库中的表) show users:显示用户 ...
分类:
数据库 时间:
2017-07-10 13:26:45
阅读次数:
232
主键的作用: 1)保证实体的完整性; 2)加快数据库的操作速度 3)在表中添加新记录时,数据库会自动检查新记录的主键值,不允许该值与其他记录的主键值重复。 4) 数据库自动按主键值的顺序显示表中的记录。如果没有定义主键,则按输入记录的顺序显示表中的记录。 主键不是非要不可,可以从: 1.是否满足业务 ...
分类:
数据库 时间:
2017-07-07 16:28:40
阅读次数:
231
集合 集合(set):把不同的元素组成一起形成集合,是python基本的数据类型。 集合元素(set elements):组成集合的成员 为什么需要集合? 集合的作用 1 .列表去重复数据 按照现有知识的解决思路:先设置空列表,然后使用for寻获,把需要去重的列表的第一个数据放到新列表中,然后依次取 ...
分类:
编程语言 时间:
2017-07-06 15:58:09
阅读次数:
298