[Python3]读写Excel - openpyxl库

时间：2017-09-10 10:14:57 阅读：184 评论：0 收藏：0 [点我收藏+]

标签：publish datetime join 结果 http https 工作注释 class

什么是openpyxl

openpyxl是一个第三方的pythonexcel读写库，支持Excel2010 xlsx/xlsm/xltx/xltm文件格式。

openpyxl提供哪些能力？

excel的基本读写能力
与pandas和numpy无缝链接能力
excel里图表管理
excel单元格注释管理

在本节我们主要分享什么？

主要分享openpyxl的excel读写功能。提供常用的代码实例。

对于图表、注释管理、pandas和numpy综合使用不在本节内容讲解范围内，有兴趣的朋友可以自己去研究。

如何安装openpyxl

使用以下命令安装openpyxl库

pip install openpyxl

导入openpyxl模块

要使用openpyxl对excel进行读写，需要导入其中的Workbook类，方法如下：

from oepnpyxl import Workbook

一个简单的示例

我们先一个简单的示例，如何是使用openpyxl写excel。

# -*- coding:utf-8 -*-

__author__ = ‘谷白‘

from openpyxl import Workbook

if __name__ == "__main__":    
    print("写excel简单示例")    

    # 创建一个excel工作区
    wb = Workbook()    

    # 激活当前工作簿
    ws = wb.active    
    
    # 往单元格A1写入数据, 其他单元格写入类似
    ws[‘A1‘] = "博客园谷白"

    # 写下一行数据，列表元素对应每一个单元格
    ws.append([1, 2, 3])    
    
    # 写入时间类型到excel, python会自动将类型转换成excel的日期时间类型
    import datetime
    ws[‘A2‘] = datetime.datetime.now()    

    # 保存为excel文件
    wb.save("简单excel写示例.xlsx")

读取已存在的excel文件

下面就上面示例生成的“简单excel写示例.xlsx”文件，进行读取，并将内容输出值console。

# -*- coding:utf-8 -*-

__author__ = ‘谷白‘


from openpyxl import load_workbook

if __name__ == "__main__":    

    print("读取已存在的excel文件")

    wb = load_workbook("简单excel写示例.xlsx")    
    
    # 获取所有sheet名, 返回的是list类型
    sheets = wb.get_sheet_names()    
    print(type(sheets))    

    # 遍历sheets，并读取其单元格内容打印输出
    for sh in sheets:        
        print("读取工作簿名称： ", sh)    

    # 获取要读取的sheet
    ws = wb.get_sheet_by_name(sheets[0])    
    
    # 读取Sheet A1 ， A2, B2, C2单元格内容

    # 读取A1单元格的值
    A1 = ws[‘A1‘].value    
    print("A1单元格的值： ", A1)    

    # 读取A2, B2, C2
    for index in (‘A2‘, ‘B2‘, ‘C2‘):        
        print(index, "单元格的值： ", ws[index].value)    
    
    # 读取空值的单元格, openpyxl对于空值的单元格，返回None
    F1 = ws[‘F1‘].value    
    print("F1单元格的值： ", F1)

高级示例

下面就使用urllib从网络爬取数据，写入excel进行示例演示，从豆瓣网爬取部分书籍数据，写入excel。

# -*- coding:utf-8 -*-

__author__ = ‘谷白‘

import urllib.request
from openpyxl import Workbook

if __name__ == "__main__":    
    print("爬取豆瓣网书籍数据写入excel示例")    
    
    # 通过豆瓣网搜索API，搜索python关键词，采集书籍数据
    # 本示例只采集第一页的数据
    url = "https://api.douban.com/v2/book/search?q=python"
    response = urllib.request.urlopen(url)    
    
    # 将bytes数据流解码成string
    ebook_str = response.read().decode()    

    # 将string转换成dict
    ebook_dict = eval(ebook_str)    
    
    # 构建一个Workbook对象
    wb = Workbook()    # 激活第一个sheet
    ws = wb.active    # 写入表头
    ws.append(["书名", "作者", "描述", "出版社", "价格"])    
    
    # 写入书信息
    for book in ebook_dict["books"]:
        ws.append([book["title"], 
            ",".join(book["author"]), 
            book["summary"], 
            book["publisher"], 
            book["price"]])    
    
    # 保存
    wb.save("ebook.xlsx")

打开ebook.xlsx查看爬取结果如下：

[Python3]读写Excel - openpyxl库

标签：publish datetime join 结果 http https 工作注释 class

原文地址：http://www.cnblogs.com/igubai/p/7500025.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行