Python并发编程实用教程
ztj100 2025-05-26 20:19 9 浏览 0 评论
一、并发编程基础
1. 并发与并行概念
定义对比:
- 并发:交替执行任务(单核)
- 并行:同时执行任务(多核)
并发vs并行示意图
并发: [任务A] <-> [任务B] <-> [任务A] <-> [任务B] (时间切片)
并行: [任务A] → 同时执行 ← [任务B] (多核)
表1 Python并发编程方式对比
方式 | 模块 | 适用场景 | 特点 |
多线程 | threading | I/O密集型 | 共享内存,GIL限制 |
多进程 | multiprocessing | CPU密集型 | 独立内存,开销大 |
协程 | asyncio | 高并发I/O | 单线程异步,高效 |
二、多线程编程
1. Thread类基础
语法定义:
from threading import Thread
t = Thread(target=函数, args=(参数,))
t.start()
t.join()
应用示例:
import time
from threading import Thread
def download_file(url):
print(f"开始下载 {url}")
time.sleep(2) # 模拟I/O操作
print(f"完成下载 {url}")
# 创建并启动线程
threads = []
for i in range(3):
t = Thread(target=download_file, args=(f"https://example.com/file{i}.zip",))
threads.append(t)
t.start()
# 等待所有线程完成
for t in threads:
t.join()
print("所有下载任务完成")
注意事项:
- 线程适合I/O密集型任务
- 受GIL限制,不适合CPU密集型任务
- 注意线程安全问题
三、多进程编程
1. Process类使用
语法定义:
from multiprocessing import Process
p = Process(target=函数, args=(参数,))
p.start()
p.join()
应用示例:
import math
from multiprocessing import Process
def calculate_factorial(n):
print(f"计算 {n} 的阶乘")
result = math.factorial(n)
print(f"{n}! = {result}")
if __name__ == '__main__':
numbers = [1000, 2000, 3000]
processes = []
for num in numbers:
p = Process(target=calculate_factorial, args=(num,))
processes.append(p)
p.start()
for p in processes:
p.join()
print("所有计算完成")
多进程内存模型
进程A ── 独立内存空间
进程B ── 独立内存空间
进程C ── 独立内存空间
四、异步编程(asyncio)
1. 协程基础
语法定义:
import asyncio
async def 协程函数():
await 异步操作
asyncio.run(协程函数())
应用示例:
import asyncio
async def fetch_data(url):
print(f"开始获取 {url}")
await asyncio.sleep(2) # 模拟I/O等待
print(f"完成获取 {url}")
return f"{url} 的数据"
async def main():
tasks = [
fetch_data("https://api.com/data1"),
fetch_data("https://api.com/data2"),
fetch_data("https://api.com/data3")
]
results = await asyncio.gather(*tasks)
print("所有结果:", results)
asyncio.run(main())
表2 同步vs异步I/O对比
特性 | 同步I/O | 异步I/O |
线程使用 | 阻塞线程 | 单线程处理 |
性能 | 低(串行) | 高(并发) |
复杂度 | 简单 | 需要async/await |
适用场景 | 简单逻辑 | 高并发网络请求 |
五、线程/进程池
1. ThreadPoolExecutor
语法定义:
from concurrent.futures import ThreadPoolExecutor
with ThreadPoolExecutor(max_workers=5) as executor:
future = executor.submit(函数, 参数)
result = future.result()
应用示例:
from concurrent.futures import ThreadPoolExecutor
import urllib.request
def download(url):
with urllib.request.urlopen(url) as response:
return f"{url}: {len(response.read())} bytes"
urls = [
"https://www.python.org",
"https://www.google.com",
"https://www.github.com"
]
with ThreadPoolExecutor(max_workers=3) as executor:
futures = [executor.submit(download, url) for url in urls]
for future in futures:
print(future.result())
2. ProcessPoolExecutor
语法定义:
from concurrent.futures import ProcessPoolExecutor
with ProcessPoolExecutor(max_workers=4) as executor:
future = executor.submit(函数, 参数)
result = future.result()
应用示例:
from concurrent.futures import ProcessPoolExecutor
import math
def compute_factorial(n):
return math.factorial(n)
numbers = [1000, 2000, 3000, 4000]
with ProcessPoolExecutor() as executor:
results = executor.map(compute_factorial, numbers)
for num, result in zip(numbers, results):
print(f"{num}! 的计算完成")
六、共享数据与同步
1. 线程安全操作
表3 线程同步原语
工具 | 用途 | 示例 |
Lock | 互斥锁 | with lock: |
RLock | 可重入锁 | with rlock: |
Semaphore | 信号量 | semaphore.acquire() |
Queue | 线程安全队列 | queue.put/get() |
应用示例:
from threading import Thread, Lock
import time
class BankAccount:
def __init__(self):
self.balance = 100
self.lock = Lock()
def deposit(self, amount):
with self.lock:
new_balance = self.balance + amount
time.sleep(0.1) # 模拟处理延迟
self.balance = new_balance
account = BankAccount()
threads = []
for _ in range(10):
t = Thread(target=account.deposit, args=(10,))
threads.append(t)
t.start()
for t in threads:
t.join()
print(f"最终余额: {account.balance}") # 正确结果200
七、应用案例
1. 并发Web爬虫示例
import asyncio
import aiohttp
from concurrent.futures import ThreadPoolExecutor
async def fetch_url(session, url):
async with session.get(url) as response:
return await response.text()
async def main():
urls = [
"https://www.python.org",
"https://www.google.com",
"https://www.github.com"
]
async with aiohttp.ClientSession() as session:
tasks = [fetch_url(session, url) for url in urls]
results = await asyncio.gather(*tasks)
for url, content in zip(urls, results):
print(f"{url}: {len(content)} bytes")
asyncio.run(main())
2. 并行数据处理示例
from multiprocessing import Pool
import pandas as pd
def process_chunk(chunk):
# 模拟耗时数据处理
return chunk.describe()
if __name__ == '__main__':
data = pd.DataFrame({'value': range(1000000)})
chunks = [data[i:i+100000] for i in range(0, len(data), 100000)]
with Pool(4) as pool:
results = pool.map(process_chunk, chunks)
final_result = pd.concat(results)
print(final_result)
八、并发编程建议
- I/O密集型:使用线程或异步
- CPU密集型:使用多进程
- 避免共享状态,使用消息传递
- 合理设置工作线程/进程数量
- 使用连接池管理资源
表4 并发问题
问题 | 解决方案 |
竞态条件 | 使用Lock/RLock |
死锁 | 避免嵌套锁,设置超时 |
资源耗尽 | 使用连接池,限制并发数 |
GIL限制 | 使用多进程或C扩展 |
总结
核心知识点:
- 多线程适合I/O密集型任务(threading)
- 多进程适合CPU密集型任务(multiprocessing)
- 协程实现高效I/O并发(asyncio)
- 线程/进程池简化资源管理(concurrent.futures)
选择指南:
I/O密集型 → 多线程/协程
CPU密集型 → 多进程
高并发网络 → 异步编程
批量计算 → 进程池
Python并发编程决策树
开始 → CPU密集型? → 是 → multiprocessing
↓否
I/O高并发? → 是 → asyncio
↓否
threading/concurrent.futures
持续更新Python编程学习日志与技巧,敬请关注!
相关推荐
- Spring IoC Container 原理解析
-
IoC、DI基础概念关于IoC和DI大家都不陌生,我们直接上martinfowler的原文,里面已经有DI的例子和spring的使用示例...
- SQL注入:程序员亲手打开的潘多拉魔盒,如何彻底封印它?
-
一、现象:当你的数据库开始"说话",灾难就来了场景还原:...
- Java核心知识3:异常机制详解
-
1什么是异常异常是指程序在运行过程中发生的,由于外部问题导致的运行异常事件,如:文件找不到、网络连接失败、空指针、非法参数等。异常是一个事件,它发生在程序运行期间,且中断程序的运行。...
- MyBatis常用工具类三-使用SqlRunner操作数据库
-
MyBatis中提供了一个非常实用的、用于操作数据库的SqlRunner工具类,该类对JDBC做了很好的封装,结合SQL工具类,能够很方便地通过Java代码执行SQL语句并检索SQL执行结果。SqlR...
- 爆肝2W字梳理50道计算机网络必问面试题
-
1.说说HTTP常用的状态码及其含义?思路:这道面试题主要考察候选人,是否掌握HTTP状态码这个基础知识点。...
- SpringBoot整合Vue3实现发送邮箱验证码功能
-
1.效果演示2.思维导图...
- 最全JAVA面试题及答案(200+)
-
Java基础1.JDK和JRE有什么区别?JDK:JavaDevelopmentKit的简称,Java开发工具包,提供了Java的开发环境和运行环境。JRE:JavaRunti...
- Java程序员找工作翻车现场!你的项目描述踩了这几个坑?
-
Java程序员找工作翻车现场!你的项目描述踩了这几个坑?噼里啪啦敲了三年代码,简历一投石沉大海?兄弟,问题可能出在项目描述上!知道为什么面试官看你的项目像看天书吗?因为你写了三个致命雷区:第一,把项目...
- 2020最新整理JAVA面试题附答案,包含19个模块共208道面试题
-
包含的模块:本文分为十九个模块,分别是:Java基础、容器、多线程、反射、对象拷贝、JavaWeb、异常、网络、设计模式、Spring/SpringMVC、SpringBoot/Spring...
- 底层原理深度解析:equals() 与 == 的 JVM 级运作机制
-
作为Java开发者,你是否曾在集合操作时遇到过对象比较的诡异问题?是否在使用HashMap时发现对象丢失?这些问题往往源于对equals()和==的误解,以及实体类中这两个方法的不当实...
- 雪花算法,什么情况下发生 ID 冲突?
-
分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的...
- 50个Java编程技巧,免费送给大家
-
一、语法类技巧1.1.使用三元表达式普通:...
- 如何规划一个合理的JAVA项目工程结构
-
由于阿里Java开发手册对于工程结构的描述仅限于1、2节简单的概述,不能满足多样的实际需求,本文根据多个项目中工程的实践,分享一种较为合理实用的工程结构。工程结构的原则有依据、实用。有依据的含义是指做...
- Java 编程技巧之单元测试用例编写流程
-
温馨提示:本文较长,同学们可收藏后再看:)前言...
- MyBatis核心源码解读:SQL执行流程的奇妙之旅
-
MyBatis核心源码解读:SQL执行流程的奇妙之旅大家好呀!今天咱们要来一场既烧脑又有趣的旅程——探索MyBatis这个强大框架的核心秘密。你知道吗?当你在项目里轻轻松松写一句“select*f...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)