1. ELK架构简介 1.1 核心组成 ELK是一套开源免费且功能强大的日志分析管理系统,由Elasticsearch、Logstash、Kibana三部分组成,简称ELK。 ELK可以将系统日志、网站日志、应用系统日志等各种日志进行收集、过滤、清洗,然后进行集中存放并可用于检索、分析。 这三款软件 ...
分类:
其他好文 时间:
2020-09-18 01:22:40
阅读次数:
31
前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 以下文章来源于大话数据分析,作者:尚天强 网站的日志数据记录了所有Web对服务器的访问活动,本节通过Python第三方库解析网站日志,利用pandas对网站日志数据进行预处理 ...
分类:
编程语言 时间:
2020-09-07 19:02:22
阅读次数:
39
1. Log Parser Lizard 介绍 Log Parser Lizard是一款强大好用的日志分析工具,使用这款软件可以方便用户对服务器日志、网站日志等进行直观用户的分析,支持基于文本的日志文件、XML 文件、CSV(逗号分隔符)文件以及注册表、文件系统等内容。 2. Windows日志分析 ...
分类:
其他好文 时间:
2020-07-05 00:59:57
阅读次数:
77
原文链接: https://www.toutiao.com/i6764933201203823107/ 概念:“数据去重”主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。 数据去重的最终目标是让原始数据 ...
分类:
其他好文 时间:
2020-03-20 00:27:36
阅读次数:
75
网站的访问日志是一个非常重要的文件,通过分析访问日志,能够挖掘出很多有价值的信息。本文介绍如何利用Python对一个真实网站的访问日志进行分析,文中将综合运用Python文件操作、字符串处理、列表、集合、字典等相关知识点。本文所用的访问日志access_log来自我个人的云服务器,大家可以从文末的附件中下载。1.提取指定日期的日志下面是一条典型的网站访问日志,客户端访问网站中的每个资源都会产生一条
分类:
编程语言 时间:
2020-02-07 20:41:10
阅读次数:
109
本课程从Hadoop核心技术入手,以电商项目为依托,带领你从0基础开始上手,逐步掌握大数据核心技术(如:HDFS、YARN、MapReduce以及Hive),并使用这些技术进行实战,最终完成电商行为日志分析项目,让你轻松入门大数据! ...
分类:
Web程序 时间:
2020-01-10 01:08:26
阅读次数:
133
很久很久以前有一个浏览器名字叫 NCSA Mosaic 很久很久以前有一个浏览器名字叫 NCSA Mosaic 紧接着也出现了一个 Mozilla 的浏览器 (Mozilla 的意思是 Mosaic 终结者)后来 Mozilla 的正式发布版本是 Netscape 它把自己标称为Mozilla/1. ...
分类:
移动开发 时间:
2020-01-08 10:19:10
阅读次数:
130
1、进入linux系统 2、在任意目录创建一个sh后缀的文件,如: 3、编辑打开该文件,如图: 4、此时按键盘上的“i”键或者“insert”键,进入编辑模式 输入: #!/bin/shfind /data/iqmkj/backup/mysql -mtime +7 -name "*.sql" -ex ...
分类:
Web程序 时间:
2019-12-18 00:05:42
阅读次数:
297
直接上图 1 清理网站日志/php站点session/系统邮件/临时文件 2 清空面板回收站 3 清除mysql二进制日志(操作过程中会停止重启数据库) 4 检查磁盘剩余空间 很显然。没什么卵用!继续查找 5 查询整个服务器磁盘空间内容 6 磁精确到www目录 这里可以适当的调整 --max-dep ...
分类:
系统相关 时间:
2019-11-25 15:23:30
阅读次数:
567
在做SEO的过程中,实际上,我并不是“技术挂”更多的是基于搜索原理与大量的实战,总结相关的经验,这么多年,经常养成一个小习惯,总是记录一些工作中遇到的一些小问题与小技巧。 特别是2017年,12月份开始跟踪熊掌号算法之后,从新进入SEO行业,我依然保留每隔一定周期审查网站日志的习惯。 读“日志”如“ ...
分类:
其他好文 时间:
2019-10-26 17:17:43
阅读次数:
90