一、数据集切割 我们通常将数据及切割成两部分:训练数据集(Training Dataset);测试数据集(Testing Dataset). 注意:可采用分层抽样的方式进行,以保持数据在目标字段上分布的一致性。 1.数据分割 ? 80%训练数据→在训练数据上可以做任何的分析? 20%测试数据→在测试 ...
分类:
其他好文 时间:
2020-06-29 09:15:40
阅读次数:
58
1、关于日志切割 日志文件包含了关于系统中发生的事件的有用信息,在排障过程中或者系统性能分析时经常被用到。对于忙碌的服务器,日志文件大小会增长极快,服务器会很快消耗磁盘空间,这成了个问题。除此之外,处理一个单个的庞大日志文件也常常是件十分棘手的事。 logrotate是个十分有用的工具,它可以自动对 ...
分类:
其他好文 时间:
2020-06-28 16:44:12
阅读次数:
58
基数排序(Java) 博客说明 文章所涉及的资料来自互联网整理和个人总结,意在于个人学习和经验汇总,如有什么地方侵权,请联系本人删除,谢谢! 基数排序(桶排序)介绍 基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或b ...
分类:
编程语言 时间:
2020-06-27 15:53:56
阅读次数:
54
这是我在给公司打工时候做的工作,现在这部分已经完成的差不多了,所以特别的在自己的博客上记录一下,给自己看,也是给有缘人看,说不定会给你灵感。 需求 给公司设计一个工具,它的输入是pdf文档,其中的内容是图片格式的许多法律条文。程序会读取所有的pdf文档,使用OpenCV对图片进行切割,使用pytes ...
分类:
Web程序 时间:
2020-06-27 09:40:08
阅读次数:
61
概述 nginx 日志一般都是两种access.log error.log ,可以每个location 区域配置一份,也就是每个请求服务一个日志。它的日志不会自动切割,需要人为根据时间或者日志量切割。 脚本完成nginx日志切割 vi /opt/nginx/cut_nginx_log.sh #!/b ...
分类:
其他好文 时间:
2020-06-25 19:27:00
阅读次数:
66
大日志文件切割shell脚本 #!/bin/bash # # 日志文件300M分割,并zip压缩,每个项目仅保留最新30个文件, # 文件格式:项目名称-年月日时分秒.zip # Author : # Date : # Email : # Version : 1.0 # # 日志目录 LOG_DIR ...
分类:
系统相关 时间:
2020-06-25 15:36:49
阅读次数:
59
由于nginx的日志本身只是支持按照server_name或者大小进行划分,对于习惯了apache的按照一个网站每天一个日志的我来说是不可以接受的,所以就实现了按天切割的功能,这篇文章主要介绍了关于Nginx日志按日期切割的相关资料,需要的朋友可以参考下。 实现需求 本文实现的功能是在吗每天凌晨00 ...
分类:
其他好文 时间:
2020-06-22 20:49:24
阅读次数:
62
字符串格式化 字符串格式化其实就是字符串的拼接,自定义将某些字符串植入到主字符串之中,这里介绍几种常用的方式。 百分号占位 tmp = '你好 我是%s,我今天挣了%.2f元钱' value = ('小明',5.32567) str = tmp % value print(str) 打印结果:你好 ...
分类:
编程语言 时间:
2020-06-22 17:06:57
阅读次数:
56
在iOS开发中,UIView有一个clipsToBounds属性,可以设置UIView是否切割Subview超出本身的部分,Apple Developer文档的定义如下: 但是在Mac开发时,首先因为相关的资料在网上很少,NSView也没有这个属性,所以对于如何在NSView中实现类似于clipsT ...
分类:
其他好文 时间:
2020-06-20 22:35:36
阅读次数:
77
v='aaa_111' array=(${v//_/ }) # 注意后面有空格 # 增加跳转小程序配置 if [[ $JUMP_XCX != '' ]]; then # 可以判断空字符串 和 空数组 NEW_JUMP_XCX='' for v in ${JUMP_XCX[@]};do array=( ...
分类:
编程语言 时间:
2020-06-20 10:59:13
阅读次数:
119