元旦假期收到阿里吴老师来电,被告知已将MySQL查重SQL优化到极致:100万原始数据,其中50万重复,把去重后的50万数据写入目标表只需要9秒钟。这是一个惊人的数字,要知道仅是insert 50万条...
分类:
数据库 时间:
2017-01-12 23:23:30
阅读次数:
876
盲评结果出来了。然而对于我并没有太大的影响。从头到尾我没有紧张过,自然也不会有如释重负的感觉。 昨天说了事情要提前做准备。早上,到教研室挺早,review的时候,发现论文中一个关于目录的小问题,解决掉之后,便开始写信。因为大家等待盲评结果的焦急心情,也不能让我平静。下午,在一个免费的查重网站上查了绪 ...
分类:
其他好文 时间:
2016-12-27 07:44:13
阅读次数:
180
对于两种去重方式: 利用distinct去重、简单易用,但只能对于单一字段去重,并且最终的结果也仅为去重的字段,实际应用价值不是特别大。 利用group去重,最终的显示结果为所有字段,且对单一字段进行了去重操作,效果不错,但最终显示结果除去去重字段外,按照第一个字段进行排序,可能还需要处理。 ...
分类:
数据库 时间:
2016-12-25 13:42:22
阅读次数:
255
1.修改my.ini,在[mysqld]下增加一行:skip-grant-tables(登录时跳过密码检查)2.重启mysql3.updatemysql.usersetauthentication_string=PASSWORD(‘newpassword‘)whereUser=‘root‘;其中PASSWORD为mysql的加密函数,按mysql的加密方式加密,再运行FLUSHPRIVILEGES;4.把my.ini修改..
分类:
数据库 时间:
2016-12-23 10:05:25
阅读次数:
215
该工具类主要完成的功能是:读取Excel、汇总Excel的功能。在读取时,可以设定开始和结束读取的位置、设定是否读取多个sheet、设定读取那个或者那些sheet等。在汇总时,如设定是否覆盖目标文件、设定是否比较检查重复内容、设定检查重复的列索引等功能。 package com.tgb.ccl.ex ...
分类:
其他好文 时间:
2016-12-19 21:03:51
阅读次数:
240
学校自查“六个必须” 1.必须召开专题会议研究部署自查自纠工作; 2.必须有安排部署文件和自查自纠工作方案; 3.所有检查排查必须建立专门档案,记录隐患排查、整改、复查、销号的全过程; 4.对排查的事故隐患必须按照“五落实”的要求,严格整改并记录在案; 5.对排查重大隐患需停课整改的必须停课整改,制 ...
分类:
其他好文 时间:
2016-12-06 13:47:52
阅读次数:
235
inArray 是jquery 用来数组查重的函数,很多时候数组中含有对象,直接查找是找不到的,必须转换成 JSON字符串来进行查找。 $map 在这里简化了很多代码。 var arr = [ {"id" : "1", "description" : "one"}, {"id" : "2", "de ...
分类:
编程语言 时间:
2016-12-02 02:05:04
阅读次数:
183
ACCESS数据的连接及语句执行操作,不难,久不用会生疏,每次都要找资料,干脆自己整理下,记录下来,需要的时候,直接查看,提高效率。也供初学者参考 1、连接字符串 public static string strConn = @"Provider=Microsoft.Jet.OLEDB.4.0;Da ...
分类:
数据库 时间:
2016-09-21 14:18:46
阅读次数:
492
Standford Moss 系统是斯坦福大学大名鼎鼎的代码查重系统,它可以查出哪些同学提交的代码是抄袭别人的,从而将提交结果拒之门外。它对一切希望使用该系统的人都是开放的,那么在PHP的项目中如何使用它呢? 下载Moss的PHP文件moss.php 您可以访问https://github.com/ ...
分类:
Web程序 时间:
2016-08-03 18:40:02
阅读次数:
482
SimHash 事实上,传统比较两个文本相似性的方法,大多是将文本分词之后,转化为特征向量距离的度量,比如常见的欧氏距离、海明距离或者余弦角度等等。两两比较固然能很好地适应,但这种方法的一个最大的缺点就是,无法将其扩展到海量数据。例如,试想像Google那种收录了数以几十亿互联网信息的大型搜索引擎, ...
分类:
其他好文 时间:
2016-08-02 00:49:42
阅读次数:
807