网站的访问日志是一个非常重要的文件,通过分析访问日志,能够挖掘出很多有价值的信息。本文介绍如何利用Python对一个真实网站的访问日志进行分析,文中将综合运用Python文件操作、字符串处理、列表、集合、字典等相关知识点。本文所用的访问日志access_log来自我个人的云服务器,大家可以从文末的附件中下载。1.提取指定日期的日志下面是一条典型的网站访问日志,客户端访问网站中的每个资源都会产生一条
分类:
编程语言 时间:
2020-02-07 20:41:10
阅读次数:
109
文件介绍 文件是数据存放的容器 文件的作用:持久性的存储数据内容 文件组成: 文件名 拓展名(有时候没有使用) 一般不同的扩展名,对应着不同的存储格式 文件内容 文本文件 二进制文件 打开文件 打开: 文件:指定文件路径 模式:控制操作模式 返回一个文件对象 关闭文件 :可以释放相关的系统资源,会立 ...
分类:
编程语言 时间:
2020-01-22 18:27:31
阅读次数:
81
文件操作 对文件操作流程 打开文件,得到文件句柄并赋值给一个变量 通过句柄对文件进行操作 关闭文件 现有文件如下 1 Somehow, it seems the love I knew was always the most destructive kind 2 不知为何,我经历的爱情总是最具毁灭性 ...
分类:
编程语言 时间:
2020-01-21 16:20:25
阅读次数:
135
记得刚开始学习python文件操作写文件的时候有个问题,很奇怪。最后知道了就是字节数的原因。 我们先来看个例子。 新建个文件存为utf-8命名为0117utf-8.txt记得去掉BOM头。 我们用r+模式尝试去修改 >>> fp=open("d:\\pydelete\\0117utf-8.txt", ...
分类:
编程语言 时间:
2020-01-17 13:33:08
阅读次数:
194
Python标准库glob介绍 一、 glob模块通配符 通配符功能 * 匹配0或多个字符 ** 匹配所有文件,目录,子目录和子目录里面的文件 (3.5版本新增) ? 匹配一个字符,这里与正则表达式? (正则?匹配前面表达式0次或者1次) [] 匹配指定范围内的字符,如: [1-9]匹配1至9内的字 ...
分类:
编程语言 时间:
2019-12-29 11:07:35
阅读次数:
136
前言 python中对文件的读写也是非常方便的,本章节将讲解读、写、读写等常用操作。下面讲师必要的参数: 1、文件路径:必须得知道文件的路径,不然怎样进行读写? 2、编码方式:utf-8,gbk,gb2312....(python3的str是unicode编码存储的,我们一般常用utf-8存在,编码 ...
分类:
编程语言 时间:
2019-12-08 10:31:05
阅读次数:
91
#字符编码: #python 3默认读取数据是 utf-8 #windows默认是gbk编码 读 with open('test','r') as f: #这个方法后面不需要关闭 file = open('test',encoding='utf-8').read() #文件不能直接读取,因为是存在内 ...
分类:
编程语言 时间:
2019-12-01 12:05:23
阅读次数:
99
f=open('my-heart','r') print(f.encoding)#返回字符编码 print(f.fileno())#返回操作系统的端口编号 print(f.seekable())#是否可以移动设备文件,一般二进制可以移动 print(f.writable())#是否可写 print( ...
分类:
编程语言 时间:
2019-11-28 01:05:03
阅读次数:
100
使用open函数可以打开文件并返回一个文件对象,返回的文件对象用来读取和写入文件内容。那么,如何使用文件对象来读取文件内容呢?如何让读取的文件内容初始化一个Python列表呢? 文本文件和二进制文件 使用文件对象读取文件内容时,要根据文件的不同存储类型选择不同的读取方式。一般来说,文件的存储类型主要 ...
分类:
编程语言 时间:
2019-11-02 00:10:34
阅读次数:
99