百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

Python并发编程实用教程

ztj100 2025-05-26 20:19 9 浏览 0 评论

#Python知识分享#

一、并发编程基础

1. 并发与并行概念

定义对比

  • 并发:交替执行任务(单核)
  • 并行:同时执行任务(多核)

并发vs并行示意图

并发: [任务A] <-> [任务B] <-> [任务A] <-> [任务B] (时间切片)
并行: [任务A] → 同时执行 ← [任务B] (多核)

表1 Python并发编程方式对比

方式

模块

适用场景

特点

多线程

threading

I/O密集型

共享内存,GIL限制

多进程

multiprocessing

CPU密集型

独立内存,开销大

协程

asyncio

高并发I/O

单线程异步,高效


二、多线程编程

1. Thread类基础

语法定义

from threading import Thread

t = Thread(target=函数, args=(参数,))
t.start()
t.join()

应用示例

import time
from threading import Thread

def download_file(url):
    print(f"开始下载 {url}")
    time.sleep(2)  # 模拟I/O操作
    print(f"完成下载 {url}")

# 创建并启动线程
threads = []
for i in range(3):
    t = Thread(target=download_file, args=(f"https://example.com/file{i}.zip",))
    threads.append(t)
    t.start()

# 等待所有线程完成
for t in threads:
    t.join()

print("所有下载任务完成")

注意事项

  • 线程适合I/O密集型任务
  • 受GIL限制,不适合CPU密集型任务
  • 注意线程安全问题

三、多进程编程

1. Process类使用

语法定义

from multiprocessing import Process

p = Process(target=函数, args=(参数,))
p.start()
p.join()

应用示例

import math
from multiprocessing import Process

def calculate_factorial(n):
    print(f"计算 {n} 的阶乘")
    result = math.factorial(n)
    print(f"{n}! = {result}")

if __name__ == '__main__':
    numbers = [1000, 2000, 3000]
    processes = []

    for num in numbers:
        p = Process(target=calculate_factorial, args=(num,))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

    print("所有计算完成")

多进程内存模型

进程A ── 独立内存空间
进程B ── 独立内存空间
进程C ── 独立内存空间

四、异步编程(asyncio)

1. 协程基础

语法定义

import asyncio

async def 协程函数():
    await 异步操作

asyncio.run(协程函数())

应用示例

import asyncio

async def fetch_data(url):
    print(f"开始获取 {url}")
    await asyncio.sleep(2)  # 模拟I/O等待
    print(f"完成获取 {url}")
    return f"{url} 的数据"

async def main():
    tasks = [
        fetch_data("https://api.com/data1"),
        fetch_data("https://api.com/data2"),
        fetch_data("https://api.com/data3")
    ]
    results = await asyncio.gather(*tasks)
    print("所有结果:", results)

asyncio.run(main())

表2 同步vs异步I/O对比

特性

同步I/O

异步I/O

线程使用

阻塞线程

单线程处理

性能

低(串行)

高(并发)

复杂度

简单

需要async/await

适用场景

简单逻辑

高并发网络请求


五、线程/进程池

1. ThreadPoolExecutor

语法定义

from concurrent.futures import ThreadPoolExecutor

with ThreadPoolExecutor(max_workers=5) as executor:
    future = executor.submit(函数, 参数)
    result = future.result()

应用示例

from concurrent.futures import ThreadPoolExecutor
import urllib.request

def download(url):
    with urllib.request.urlopen(url) as response:
        return f"{url}: {len(response.read())} bytes"

urls = [
    "https://www.python.org",
    "https://www.google.com",
    "https://www.github.com"
]

with ThreadPoolExecutor(max_workers=3) as executor:
    futures = [executor.submit(download, url) for url in urls]
    for future in futures:
        print(future.result())

2. ProcessPoolExecutor

语法定义

from concurrent.futures import ProcessPoolExecutor

with ProcessPoolExecutor(max_workers=4) as executor:
    future = executor.submit(函数, 参数)
    result = future.result()

应用示例

from concurrent.futures import ProcessPoolExecutor
import math

def compute_factorial(n):
    return math.factorial(n)

numbers = [1000, 2000, 3000, 4000]

with ProcessPoolExecutor() as executor:
    results = executor.map(compute_factorial, numbers)
    for num, result in zip(numbers, results):
        print(f"{num}! 的计算完成")

六、共享数据与同步

1. 线程安全操作

表3 线程同步原语

工具

用途

示例

Lock

互斥锁

with lock:

RLock

可重入锁

with rlock:

Semaphore

信号量

semaphore.acquire()

Queue

线程安全队列

queue.put/get()

应用示例

from threading import Thread, Lock
import time

class BankAccount:
    def __init__(self):
        self.balance = 100
        self.lock = Lock()
    
    def deposit(self, amount):
        with self.lock:
            new_balance = self.balance + amount
            time.sleep(0.1)  # 模拟处理延迟
            self.balance = new_balance

account = BankAccount()
threads = []

for _ in range(10):
    t = Thread(target=account.deposit, args=(10,))
    threads.append(t)
    t.start()

for t in threads:
    t.join()

print(f"最终余额: {account.balance}")  # 正确结果200

七、应用案例

1. 并发Web爬虫示例

import asyncio
import aiohttp
from concurrent.futures import ThreadPoolExecutor

async def fetch_url(session, url):
    async with session.get(url) as response:
        return await response.text()

async def main():
    urls = [
        "https://www.python.org",
        "https://www.google.com",
        "https://www.github.com"
    ]
    
    async with aiohttp.ClientSession() as session:
        tasks = [fetch_url(session, url) for url in urls]
        results = await asyncio.gather(*tasks)
        for url, content in zip(urls, results):
            print(f"{url}: {len(content)} bytes")

asyncio.run(main())

2. 并行数据处理示例

from multiprocessing import Pool
import pandas as pd

def process_chunk(chunk):
    # 模拟耗时数据处理
    return chunk.describe()

if __name__ == '__main__':
    data = pd.DataFrame({'value': range(1000000)})
    chunks = [data[i:i+100000] for i in range(0, len(data), 100000)]
    
    with Pool(4) as pool:
        results = pool.map(process_chunk, chunks)
    
    final_result = pd.concat(results)
    print(final_result)

八、并发编程建议

  1. I/O密集型:使用线程或异步
  2. CPU密集型:使用多进程
  3. 避免共享状态,使用消息传递
  4. 合理设置工作线程/进程数量
  5. 使用连接池管理资源

表4 并发问题

问题

解决方案

竞态条件

使用Lock/RLock

死锁

避免嵌套锁,设置超时

资源耗尽

使用连接池,限制并发数

GIL限制

使用多进程或C扩展

总结

核心知识点

  1. 多线程适合I/O密集型任务(threading)
  2. 多进程适合CPU密集型任务(multiprocessing)
  3. 协程实现高效I/O并发(asyncio)
  4. 线程/进程池简化资源管理(concurrent.futures)

选择指南

I/O密集型 → 多线程/协程
CPU密集型 → 多进程
高并发网络 → 异步编程
批量计算 → 进程池

Python并发编程决策树

开始 → CPU密集型? → 是 → multiprocessing
            ↓否
          I/O高并发? → 是 → asyncio
            ↓否
          threading/concurrent.futures

持续更新Python编程学习日志与技巧,敬请关注!


#编程# #python# #在头条记录我的2025#


相关推荐

Spring IoC Container 原理解析

IoC、DI基础概念关于IoC和DI大家都不陌生,我们直接上martinfowler的原文,里面已经有DI的例子和spring的使用示例...

SQL注入:程序员亲手打开的潘多拉魔盒,如何彻底封印它?

一、现象:当你的数据库开始"说话",灾难就来了场景还原:...

Java核心知识3:异常机制详解

1什么是异常异常是指程序在运行过程中发生的,由于外部问题导致的运行异常事件,如:文件找不到、网络连接失败、空指针、非法参数等。异常是一个事件,它发生在程序运行期间,且中断程序的运行。...

MyBatis常用工具类三-使用SqlRunner操作数据库

MyBatis中提供了一个非常实用的、用于操作数据库的SqlRunner工具类,该类对JDBC做了很好的封装,结合SQL工具类,能够很方便地通过Java代码执行SQL语句并检索SQL执行结果。SqlR...

爆肝2W字梳理50道计算机网络必问面试题

1.说说HTTP常用的状态码及其含义?思路:这道面试题主要考察候选人,是否掌握HTTP状态码这个基础知识点。...

SpringBoot整合Vue3实现发送邮箱验证码功能

1.效果演示2.思维导图...

最全JAVA面试题及答案(200+)

Java基础1.JDK和JRE有什么区别?JDK:JavaDevelopmentKit的简称,Java开发工具包,提供了Java的开发环境和运行环境。JRE:JavaRunti...

Java程序员找工作翻车现场!你的项目描述踩了这几个坑?

Java程序员找工作翻车现场!你的项目描述踩了这几个坑?噼里啪啦敲了三年代码,简历一投石沉大海?兄弟,问题可能出在项目描述上!知道为什么面试官看你的项目像看天书吗?因为你写了三个致命雷区:第一,把项目...

2020最新整理JAVA面试题附答案,包含19个模块共208道面试题

包含的模块:本文分为十九个模块,分别是:Java基础、容器、多线程、反射、对象拷贝、JavaWeb、异常、网络、设计模式、Spring/SpringMVC、SpringBoot/Spring...

底层原理深度解析:equals() 与 == 的 JVM 级运作机制

作为Java开发者,你是否曾在集合操作时遇到过对象比较的诡异问题?是否在使用HashMap时发现对象丢失?这些问题往往源于对equals()和==的误解,以及实体类中这两个方法的不当实...

雪花算法,什么情况下发生 ID 冲突?

分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的...

50个Java编程技巧,免费送给大家

一、语法类技巧1.1.使用三元表达式普通:...

如何规划一个合理的JAVA项目工程结构

由于阿里Java开发手册对于工程结构的描述仅限于1、2节简单的概述,不能满足多样的实际需求,本文根据多个项目中工程的实践,分享一种较为合理实用的工程结构。工程结构的原则有依据、实用。有依据的含义是指做...

Java 编程技巧之单元测试用例编写流程

温馨提示:本文较长,同学们可收藏后再看:)前言...

MyBatis核心源码解读:SQL执行流程的奇妙之旅

MyBatis核心源码解读:SQL执行流程的奇妙之旅大家好呀!今天咱们要来一场既烧脑又有趣的旅程——探索MyBatis这个强大框架的核心秘密。你知道吗?当你在项目里轻轻松松写一句“select*f...

取消回复欢迎 发表评论: