百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

Python 第6讲 File IO

ztj100 2025-03-06 22:02 8 浏览 0 评论

  • File I/O
  • open
  • with
  • CSV
  • Binary Files and PIL
  • Summing Up

File I/O


  • 到目前为止,我们编写的所有程序都是在内存中存储信息的,也就是说,一旦程序结束,从用户那里收集到的或程序生成的所有信息都将丢失。
  • 文件I/O是程序将文件作为输入或创建文件作为输出的能力。
  • 首先,请在终端窗口中键入code names.py 和代码如下:
name = input("What's your name?" )
print(f"hello, {name}")

请注意,运行这段代码会得到所需的输出。用户可以输入一个名称。输出与预期的一样。

  • 但是,如果我们希望允许输入多个名称,该怎么办?我们如何实现这一点?回想一下list 是一个数据结构,允许我们将多个值存储到一个变量中。代码如下:
names = []

for _ in range(3):
	names = input("What's your name?")
	names.append(name)

请注意,系统将提示用户输入三次。append 方法用于添加name 到我们的names 的列表。

  • 此代码可简化为以下代码:
names = []

for _ in range(3):
	names.append(input("What's your name?" ))

请注意,这与前面的代码块具有相同的结果。

  • 现在,让我们启用将姓名列表打印为排序列表的功能。代码如下:
names = []

for _ in range(3):
	names.append(input("What's your name?" ))

for name in sorted(names):
	print(f"hello, {name}")

注意一旦这个程序被执行,所有的信息都丢失了。文件I/O允许你的程序存储这些信息,以便以后使用。

  • 你可以在Python的文档中了解更多信息sorted

open


  • open 是Python中内置的一个函数,它允许你打开一个文件并在程序中使用它。open 函数可让你打开文件,以便读取或写入文件。
  • 为了向你展示如何在程序中启用文件I/O,让我们倒回一点,并编写如下代码:
name = input("What's your name? ")

file = open("names.txt", "w")
file.write(name)
file.close()

请注意,open 函数打开一个名为names.txt 启用写入,如w。上面的代码将打开的文件分配给一个名为file的变量。这行file.write(name) 将名称写入文本文件。其后的一行将关闭文件。

  • 通过键入以下命令测试代码python names.py,你可以输入一个名称,然后将其保存到文本文件中。但是,如果你使用不同的名称多次运行程序,你会注意到该程序将完全重写names.txt 文件。
  • 理想情况下,我们希望能够将我们每个人的名字附加到文件中。通过在终端窗口中输入rm names.txt删除现有文件 。然后,按如下所示修改代码:
name = input("What's your name? ")

file = open("names.txt", "a")
file.write(name)
file.close()

请注意,对我们代码的唯一更改是w 已被更改为a 即“append”。重新运行这个程序多次,你会注意到名字会被添加到文件中。但是,你会注意到一个新的问题!

  • 在多次运行程序后检查文本文件,你会注意到这些名称是连在一起的。这些名称被追加,每个名称之间没有任何间隔。你可以解决此问题。同样,通过键入以下命令删除现有文本文件rm names.txt 。然后,按如下所示修改代码:
name = input("What's your name? ")

file = open("names.txt", "a")
file.write(f"{name}\n")
file.close()

请注意,带有file.write 已修改为在每个名称的结尾添加换行符。

  • 这段代码运行得很好。但是,有一些方法可以改进这个程序。它很容易忘记关闭文件。
  • 你可以在Python的文档中了解更多信息open

with


  • 关键字with 可让你自动关闭文件。
  • 按如下所示修改代码:
name = input("What's your name? ")

with open("names.txt", "a") as file:
	file.write(f"{name}\n")

请注意,下面的行with 是缩进的。

  • 到目前为止,我们一直以独占方式写入文件。如果我们想从文件读取,该怎么办?要启用此功能,请按如下所示修改代码:
with open("names.txt", "r") as file:
	lines = file.readlines()

for line in lines:
	print("hello,", line)

请注意,readlines 有一种特殊的能力,可以读取文件中的所有行,并将它们存储在一个名为lines的文件中。运行程序时,你会注意到输出相当难看。在应该只有一个换行符的地方,似乎出现了多个换行符。

  • 有很多方法可以解决这个问题。但是,这里有一个简单的方法可以在我们的代码中解决这个错误:
with open("names.txt", "r") as file:
	lines = file.readlines()

for line in lines:
	print("hello,", line.rstrip())

请注意,rstrip 具有移除每行结尾处多余换行符的效果。

  • 不过,这段代码还可以进一步简化:
with open("names.txt", "r") as file:
	for line in file:
		print("hello,", line.rstrip())

请注意,运行此代码是正确的。但是,请注意,我们没有对名称进行排序。

  • 此代码可以进一步改进,以便对名称进行排序:
names = []

with open("names.txt") as file:
	for line in file:
		names.append(line.rstrip())

for name in sorted(names):
	print(f"hello, {name}")

请注意,names 是一个空白列表,我们可以在其中收集姓名。每个姓名都附加到names 列表。然后,将打印内存中已排序列表中的每个名称。运行代码,你将看到名称现在已正确排序。

  • 如果我们想要存储的不仅仅是学生的名字,如果我们想要同时存储学生的名字和他们的房子呢?

CSV


  • CSV代表“逗号分隔值”。
  • 在终端窗口中,键入code students.csv。请确保新CSV文件如下所示:
Hermoine,Gryffindor
Harry,Gryffindor
Ron,Gryffindor
Draco,Slytherin
  • 让我们通过键入以下命令创建一个新程序code students.py 和代码如下:
with open("students.csv") as file:
	for line in file:
		row = line.rstrip().split(",")
		print(f"{row[0]} is in {row[1]}")

请注意,rstrip 删除CSV文件中每一行的末尾。split 告诉编译器在CSV文件中查找每个值的结尾。row[0] 是CSV文件每一行的第一个元素。row[1] 是CSV文件中每行的第二个元素。

  • 上面的代码可以有效地划分CSV文件的每一行或“记录”。但是,如果你不熟悉这种语法,看起来有点晦涩。Python内置的功能可以进一步简化这段代码。修改代码如下:
with open("students.csv") as file:
	for line in file:
		name, house = line.rstrip().split(",")
		print(f"{name} is in {house}")

请注意,split 函数实际上返回两个值:逗号前的一个和逗号后的一个。因此,我们可以依靠该功能一次赋值两个变量,而不是一个!

  • 假设我们想再次提供这个列表作为排序输出,你可以修改你的代码如下:
students = []

with open("students.csv") as file:
	for line in file:
		name, house = line.rstrip().split(",")
		students.append(f"{name} is in {house}")

for student in sorted(students):
	print(student)

请注意,我们会建立被称为studentslist 。我们append 每个字符串附加到此列表。然后输出一个排序后的列表。

  • 回想一下,Python允许dictionaries 其中键可以与值相关联。此代码可以进一步改进
students = []

with open("students.csv") as file:
	for line in file:
		name, house = line.rstrip().split(",")
		student = {}
		student["name"] = name
		student["house"] = house
		students.append(student)

for student in students:
	print(f"{student['name']} is in {student['house']}")

请注意,我们创建了一个名为student的字典。我们将每个学生的值(包括他们的姓名和房子)添加到student 字典。然后,我们将该学生附加到被称为studentslist

  • 我们可以改进我们的代码来说明这一点,如下所示:
students = []

with open("students.csv") as file:
	for line in file:
		name, house = line.rstrip().split(",")
		student = {"name": name, "house": house}
		students.append(student)

for student in students:
	print(f"{student['name']} is in {student['house']}")

请注意,这会产生所需的结果,没有按照学生排序。

  • 不幸的是,我们不能像以前那样对学生进行排序,因为现在每个学生都是列表中的一个字典。如果python可以对student 字典中的students 列表进行排序,按学生姓名对字典列表进行排序,那将很有帮助。
  • 要在我们的代码中实现这一点,请进行以下更改:
students = []

with open("students.csv") as file:
	for line in file:
		name, house = line.rstrip().split(",")
		students.append({"name": name, "house": house})


def get_name(student):
	return student["name"]


for student in sorted(students, key=get_name):
	print(f"{student['name']} is in {student['house']}")

请注意,sorted 需要知道如何获得每个学生的键。Python允许使用一个名为key 在这里我们可以定义学生列表将按什么“键”排序。因此,get_name 函数只返回student["name"]。运行此程序,你将看到列表现在按名称排序。

  • 不过,我们的代码还可以进一步改进。get_name 你可以用下面的方式简化你的代码。修改你的代码如下:
students = []

with open("students.csv") as file:
	for line in file:
		name, house = line.rstrip().split(",")
		students.append({"name": name, "house": house})

for student in sorted(students, key=lambda student: student["name"]):
	print(f"{student['name']} is in {student['house']}")

请注意我们如何使用lambda 一个匿名函数,它会说:“嘿,Python,这里有一个没有名字的函数:给定一个student,访问其name 并将其返回给key

  • 不幸的是,我们的代码有点脆弱。假设我们更改了CSV文件,以指示每个学生的成长地。这对我们的程序会有什么影响?首先,修改你的students.csv 文件如下:
Harry,"Number Four, Privet Drive"
Ron,The Burrow
Draco,Malfoy Manor

请注意,运行我们的程序将产生大量错误。

  • 现在我们要处理的是home而不是house,请按如下所示修改代码:
students = []

with open("students.csv") as file:
	for line in file:
		name, home = line.rstrip().split(",")
		students.append({"name": name, "home": home})

for student in sorted(students, key=lambda student: student["name"]):
	print(f"{student['name']} is in {student['home']}")

请注意,运行我们的程序仍然不能正常工作。你能猜到原因吗?

  • 这个ValueError: too many values to unpack 编译器产生错误的原因是,我们之前创建了此程序,希望CSV文件split 使用, (逗号)。我们可以花更多的时间来解决这个问题,但实际上已经有人开发了一种“解析”(即读取)CSV文件的方法!
  • Python的内置csv 库附带了一个名为reader。顾名思义,我们可以使用reader 来读取我们的CSV文件,尽管“Number Four,Privet Drive”中有额外的逗号。reader 在一个for 循环,其中每个迭代reader 为我们提供CSV文件中的另一行。该行本身是一个列表,其中列表中的每个值对应于该行中的一个元素。row[0]是给定行的第一个元素,而row[1] 是第二个元素。
import csv

students = []

with open("students.csv") as file:
	reader = csv.reader(file)
	for row in reader:
		students.append({"name": row[0], "home": row[1]})

for student in sorted(students, key=lambda student: student["name"]):
	print(f"{student['name']} is from {student['home']}")

请注意,我们的程序现在按预期工作。

  • 到目前为止,我们一直依赖程序来确定CSV文件的哪些部分是名字,哪些部分是家。不过,更好的设计是,通过编辑CSV文件,将其直接保存到CSV文件中,如下所示:
name,home
Harry,"Number Four, Privet Drive"
Ron,The Burrow
Draco,Malfoy Manor

请注意,我们如何在CSV文件中明确声明,任何阅读它的操作都应该期望每行中有一个name值和一个home值。

  • 我们可以修改代码以使用csv 库称为DictReader 更灵活地处理CSV文件:
import csv

students = []

with open("students.csv") as file:
	reader = csv.DictReader(file)
	for row in reader:
		students.append({"name": row["name"], "home": row["home"]})

for student in sorted(students, key=lambda student: student["name"]):
	print(f"{student['name']} is in {student['home']}")

请注意,我们已取代readerDictReader,它一次返回一个字典。另外,请注意编译器将直接访问row 字典,获取namehome 这是一个防御性编码的例子。只要设计CSV文件的人在第一行输入了正确的头信息,我们就可以使用我们的程序访问这些信息。

  • 到目前为止,我们一直在阅读CSV文件。如果我们想写入CSV文件,该怎么办?
  • 开始,让我们稍微清理一下文件。首先,删除students.csv 文件,通过在终端窗口中输入键入rm students.csv来删除 文件 。这个命令只有在你和students.csv位于同一个文件夹时才有效。
  • 然后,在students.py中,请按如下所示修改代码:
import csv

name = input("What's your name? ")
home = input("Where's your home? ")

with open("students.csv", "a") as file:
	writer = csv.DictWriter(file, fieldnames=["name", "home"])
	writer.writerow({"name": name, "home": home})

请注意,我们是如何利用DictWriter的内置功能,它采用两个参数:要写入的file ,要写入的fieldnames。此外,请注意writerow 函数将字典作为参数。实际上,我们是在告诉编译器写一行,其中包含两个名为namehome

  • 请注意,有许多类型的文件可供你读取和写入。
  • 你可以在Python的文档中了解更多信息CSV格式。

Binary Files andPIL


  • 今天我们要讨论的另一种文件类型是二进制文件。二进制文件只是1和0的集合。这种类型的文件可以存储任何东西,包括音乐和图像数据。
  • 有一个流行的Python库叫做PIL 可以很好地处理图像文件。
  • 动画GIF是一种常用的图像文件类型,其中包含许多图像文件,这些图像文件按顺序反复播放,从而创建出过于简单的动画或视频效果。
  • 假设我们有一系列服装,如下图所示。
  • 这里是costume1.gif
  • 这是另一个叫做costume2.gif。请注意腿部位置的细微差异。
  • 在继续之前,请确保你已经从课程网站下载了源代码文件。如果你没有以上两个图像并将其存储在IDE中,则无法编写以下代码。
  • 在终端窗口中键入code costumes.py 和代码如下:
import sys

from PIL import Image

images = []

for arg in sys.argv[1:]:
	image = Image.open(arg)
	images.append(image)

images[0].save(
	"costumes.gif", save_all=True, append_images=[images[1]], duration=200, loop=0
)

请注意,我们导入Image 函数来自PIL。请注意,第一个for 循环只是循环访问作为命令行参数提供的图像,并将主题存储到 被称为imageslist中。1: 开始在其第二个元素处对argv进行分隔。 最后几行代码保存第一个图像,并向其追加第二个图像,从而创建一个动画gif。在终端窗口中键入python costumes.py costume1.gif costume2.gif 。现在,输入code costumes.gif 到终端窗口中,你现在可以看到一个动画GIF。

  • 你可以在Pillow的文档中了解更多信息PIL。

Summing Up


现在,我们不仅看到我们可以读写文本文件-我们也可以读写文件使用1和0。我们迫不及待地想看看你实现这些新的能力下一个。

  • 文件I/O
  • open
  • with
  • CSV格式
  • PIL

相关推荐

告别手动操作:一键多工作表合并的实用方法

通常情况下,我们需要将同一工作簿内不同工作表中的数据进行合并处理。如何快速有效地完成这些数据的整合呢?这主要取决于需要合并的源数据的结构。...

【MySQL技术专题】「优化技术系列」常用SQL的优化方案和技术思路

概述前面我们介绍了MySQL中怎么样通过索引来优化查询。日常开发中,除了使用查询外,我们还会使用一些其他的常用SQL,比如INSERT、GROUPBY等。对于这些SQL语句,我们该怎么样进行优化呢...

9.7寸视网膜屏原道M9i双系统安装教程

泡泡网平板电脑频道4月17日原道M9i采用Win8安卓双系统,对于喜欢折腾的朋友来说,刷机成了一件难事,那么原道M9i如何刷机呢?下面通过详细地图文,介绍原道M9i的刷机操作过程,在刷机的过程中,要...

如何做好分布式任务调度——Scheduler 的一些探索

作者:张宇轩,章逸,曾丹初识Scheduler找准定位:分布式任务调度平台...

mysqldump备份操作大全及相关参数详解

mysqldump简介mysqldump是用于转储MySQL数据库的实用程序,通常我们用来迁移和备份数据库;它自带的功能参数非常多,文中列举出几乎所有常用的导出操作方法,在文章末尾将所有的参数详细说明...

大厂面试冲刺,Java“实战”问题三连,你碰到了哪个?

推荐学习...

亿级分库分表,如何丝滑扩容、如何双写灰度

以下是基于亿级分库分表丝滑扩容与双写灰度设计方案,结合架构图与核心流程说明:一、总体设计目标...

MYSQL表设计规范(mysql表设计原则)

日常工作总结,不是通用规范一、表设计库名、表名、字段名必须使用小写字母,“_”分割。...

怎么解决MySQL中的Duplicate entry错误?

在使用MySQL数据库时,我们经常会遇到Duplicateentry错误,这是由于插入或更新数据时出现了重复的唯一键值。这种错误可能会导致数据的不一致性和完整性问题。为了解决这个问题,我们可以采取以...

高并发下如何防重?(高并发如何防止重复)

前言最近测试给我提了一个bug,说我之前提供的一个批量复制商品的接口,产生了重复的商品数据。...

性能压测数据告诉你MySQL和MariaDB该怎么选

1.压测环境为了尽可能的客观公正,本次选择同一物理机上的两台虚拟机,一台用作数据库服务器,一台用作运行压测工具mysqlslap,操作系统均为UbuntuServer22.04LTS。...

屠龙之技 --sql注入 不值得浪费超过十天 实战中sqlmap--lv 3通杀全国

MySQL小结发表于2020-09-21分类于知识整理阅读次数:本文字数:67k阅读时长≈1:01...

破防了,谁懂啊家人们:记一次 mysql 问题排查

作者:温粥一、前言谁懂啊家人们,作为一名java开发,原来以为mysql这东西,写写CRUD,不是有手就行吗;你说DDL啊,不就是设计个表结构,搞几个索引吗。...

SpringBoot系列Mybatis之批量插入的几种姿势

...

MySQL 之 Performance Schema(mysql安装及配置超详细教程)

MySQL之PerformanceSchema介绍PerformanceSchema提供了在数据库运行时实时检查MySQL服务器的内部执行情况的方法,通过监视MySQL服务器的事件来实现监视内...

取消回复欢迎 发表评论: