标签:列表生成式 函数调用 出错 权重 counter pen 概念 href 解释
要实现多任务,设计Master-Worker模式,Master负责分配任务,Worker负责执行任务
并发:不是指同一时刻有多个操作同时进行,实际上,在某个特定时刻,只允许有一个操作发生,线程/任务之间互相切换,直到完成,threading和asyncio
并行:同一时刻,同时发生,multi-processing,m个处理器,开m个进程
import concurrent.futures
import requests
import threading
import time
def download_one(url):
resp = requests.get(url)
print(‘Read {} from {}‘.format(len(resp.content), url))
def download_all(sites):
# 并发模式,创建了一个线性池,总共有5个线性可以分配使用
with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
# 对sites中的每个元素,并发地调用函数download_one
executor.map(download_one, sites)
# 并行模式,创建进程池,系统自动返回CPU的数量作为可以调用的进程数
# with concurrent.futures.ProcessPoolExecutor() as executor: #
# 另一种写法
# def download_all(sites):
# with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
# to_do =[] #
# for site in sites:
# future = executor.submit(download_one, site)
# to_do.append(future)
# for future in concurrent.futures.as_completed(to_do):
# future.result()
def main():
sites = [
‘https://en.wikipedia.org/wiki/Portal:Arts‘,
‘https://en.wikipedia.org/wiki/Portal:History‘,
‘https://en.wikipedia.org/wiki/Portal:Society‘,
‘https://en.wikipedia.org/wiki/Portal:Biography‘
]
start_time = time.perf_counter()
download_all(sites)
end_time = time.perf_counter()
print(f‘Download {len(sites)} sites in {end_time - start_time} seconds‘)
if __name__ == ‘__main__‘:
main()
Read 182102 from https://en.wikipedia.org/wiki/Portal:Arts
Read 245181 from https://en.wikipedia.org/wiki/Portal:Society
Read 206928 from https://en.wikipedia.org/wiki/Portal:History
Read 336222 from https://en.wikipedia.org/wiki/Portal:Biography
Download 4 sites in 0.22546189799322747 seconds
? 全局解释器锁的存在,GIL(Global Interpreter Lock)
单线程的异步编程模型称为协程。在执行过程中,在子程序内部可中断,然后转而执行别的子程序,在适当的时候再返回来接着执行,注意,这不是函数调用。
Async异步:不同操作间可以相互交替执行,如果其中的某个操作被block了,程序并不会等待,而是找出可执行的操作继续执行
sync同步:指操作一个接一个地执行,下一个操作必须等上一个操作完成后才能执行
event loop对象维护两个任务列表,预备状态和等待状态,选取预备状态的一个任务,使其运行,一直到这个任务把控制权交还给event loop为止,当任务把控制权交还给event loop时,如果任务完成,它则将其放到预备状态的列表,否则,放在等待状态的列表,然后遍历等待状态的列表,查看它们是否完成,而原先在预备状态列表的任务位置仍旧不变,因为它们还未运行。当所有任务被重新放置在合适的列表后,新一轮的循环又开始了。
导入内置库 asyncio
async 修饰词声明异步函数,调用异步函数,便可得到一个协程对象
协程的执行:
import asyncio
async def crawl_page(url):
print(‘crawling {}‘.format(url))
sleep_time = int(url.split(‘_‘)[-1])
await asyncio.sleep(sleep_time) # 从当前任务切出,事件调读器开始调度
print(‘OK {}‘.format(url)) # 任务完成后,从事件循环中退出
async def main(urls):
tasks = [asyncio.create_task(crawl_page(url)) for url in urls] # 列表生成式
for task in tasks: # 多个任务被创建,进入事件循环等待运行
await task # 执行,用户选择从当前主任务中切出,事件调度器开始调度
# await asyncio.gather(*tasks)
asyncio.run(main([‘url_1‘, ‘url_2‘, ‘url_3‘, ‘url_4‘]))
########## 输出 ##########
crawling url_1
crawling url_2
crawling url_3
crawling url_4
OK url_1
OK url_2
OK url_3
OK url_4
import asyncio
async def worker_1():
await asyncio.sleep(1) # 4.从当前任务切出,事件调读器开始调度任务2
return 1 # 7.1秒后,事件调读器将控制权重新传给任务1,返回1,任务1完成,从事件循环中退出,并把控制器传给主任务
async def worker_2(): # 协程运行时出现错误
await asyncio.sleep(2) #5.从当前任务切出,事件调读器开始调度任务3,
return 2 / 0 # 8.2秒后,事件调读器将控制器重新传给任务2,运行出错,从事件循环中退出,控制器传给主任务
async def worker_3():
await asyncio.sleep(3) # 6.从当前任务中切出,事件调读器暂停调度
return 3 # 9.触发限定运行规则,任务3被取消,退出事件循环
async def main():
task_1 = asyncio.create_task(worker_1()) # 2.任务123被创建,并进入事件循环等待运行
task_2 = asyncio.create_task(worker_2())
task_3 = asyncio.create_task(worker_3())
await asyncio.sleep(2) # 给任务3限定运行时间,一旦超时就取消
task_3.cancel()
res = await asyncio.gather(task_1, task_2, task_3, return_exceptions=True) # 3.执行任务,用户选择从当前的主任务中切出,事件调读器开始调度任务1
print(res) # 10.主任务输出res,协程任务结束,事件循环结束
asyncio.run(main()) # 1.程序进入main()函数,事件循环开启
########## 输出 ##########
[1, ZeroDivisionError(‘division by zero‘), CancelledError()]
标签:列表生成式 函数调用 出错 权重 counter pen 概念 href 解释
原文地址:https://www.cnblogs.com/donghe123/p/13277492.html