超详细的pg12.2数据库五种备份恢复机制总结,值得收藏
ztj100 2025-01-03 20:48 28 浏览 0 评论
概述
备份重于一切,今天主要介绍PG的五种备份方式,仅供参考。
ps:前四种重点掌握
一、pg_dump备份及pg_restore恢复
1、语法
可以在本地及远程进行备份,只需要表的读权限即可备份。pg_dump创建的备份是一致的,在pg_dump运行时数据库产生快照,不阻塞数据库的DML操作,但是会阻塞需要排他锁的操作,如alter table等。特别注意的是,pg_dump一次只能备份一个单独的数据库,且不能备份角色和表空间信息(因为这些信息是cluster-wide,而不是在某个数据库中(per-database))。
使用pg_dump的自定义转储格式。. 如果PostgreSQL所在的系统上安装了zlib压缩库,自定义转储格式将在写出数据到输出文件时对其压缩。这将产生和使用gzip时差不多大小的转储文件,但是这种方式的一个优势是其中的表可以被有选择地恢复。
下面的命令使用自定义转储格式来转储一个数据库:
pg_dump -Fc dbname > filename
自定义格式的转储不是psql的脚本,只能通过pg_restore恢复,例如:
pg_restore -d dbname filename
pg_dump [OPTION]... [DBNAME]
pg_restore [OPTION]... [FILE]
2、常见用法
--导出指定库(不含create database语句)
pg_dump -h xx.xx..142 -U hwb -p 55432 -d pas_db > /data/pgbackup/pas_db_bak202012.sql
#导出指定库(包含create database语句)
pg_dump -h xx.xx..142 -U hwb -p 55432 -C pas_db > /data/pgbackup/pas_db_bak202012.sql
--导出指定库,结果以自定义压缩格式输出
pg_dump -Fc -h xx.xx..142 -U hwb -p 55432 -d pas_db > /data/pgbackup/pas_db_bak202012.dump
--备份表
pg_dump -h xx.xx..142 -U hwb -p 55432 -d pas_db -t t1 -t t2 > /data/pgbackup/t.sql
--备份某个模式所有表(schema名为hwb)
pg_dump -h xx.xx.142 -U hwb -p 55432 -d pas_db -t 'hwb.*' > /data/pgbackup/schema_202012.sql
--备份某个模式所有表,排除一张表
pg_dump -h xx.xx.142 -U hwb -p 55432 -d pas_db -t 'hwb.*' -T hwb.t1 > /data/pgbackup/schema_t1_202012.sql
--还原(导入postgres库,自动创建schema和表)
pg_restore -h xx.xx.142 -U postgres -p 55432 -d postgres -v /data/pgbackup/pas_db_bak202012.dump
--single-transaction表示整个恢复过程是一个事务,要么成功要么回滚
--恢复后需运行ANALYZE收集统计信息
psql -h xx.xx.142 -U postgres -p 55432 -d postgres --single-transaction < /data/pgbackup/pas_db_bak202012.sql
二、pg_dumpall备份与恢复
pg_dump只备份数据库集群中的某个数据库的数据,它不会导出角色和表空间相关的信息。pg_dumpall则可以导出整个数据库集群中所有的数据库中的数据,同时也会导出角色、用户和表空间的定义信息。
执行pg_dumpall需要超级用户权限。
1、语法
pg_dumpall [OPTION]...
2、常用用法
--导出所有database(当应用需要OID字段的话(比如在外键约束中用到),需添加-o选项)
pg_dumpall -v > /data/pgbackup/db_all.dmp
--只转储全局对象(角色和表空间),而不转储数据库
pg_dumpall -g -v > /data/pgbackup/role_tbs.sql
---r(roles-only)只转储角色,不转储数据库或表空间
pg_dumpall -r -v > /data/pgbackup/role.sql
-s(schema-only)只输出对象定义(模式),不输出数据
pg_dumpall -s -v > /data/pgbackup/schema.sql
--恢复(执行这个命令的时候连接到哪个数据库无关紧要,因为pg_dumpall 创建的脚本会包含创建和连接数据库的命令)
--恢复时需删对应数据库,否则如果数据库存在对应的表会自动插入新的数据
psql postgres -f db_all.dmp
三、COPY备份与恢复
COPY在PostgreSQL表和文件之间交换数据。 COPY TO把一个表的所有内容都拷贝到一个文件,而COPY FROM从一个文件里拷贝数据到一个表里(把数据附加到表中已经存在的内容里)。 COPY TO还能拷贝SELECT查询的结果。
如果声明了一个字段列表,COPY将只在文件和表之间拷贝已声明字段的数据。 如果表中有任何不在字段列表里的字段,那么COPY FROM将为那些字段插入缺省值。
带文件名的COPY指示PostgreSQL服务器直接从文件中读写数据。 如果声明了文件名,那么服务器必须可以访问该文件,而且文件名必须从服务器的角度声明。 如果使用了PROGRAM选项,则服务器会从指定的这个程序进行输入或是写入该程序作为输出。 如果使用了STDIN 或STDOUT选项,那么数据将通过客户端和服务器之间的连接来传输。
注意:copy命令必须在plsql命令行执行,执行用户必须为superuser,普通用户进行执行,需要在copy前面加入 “\”,即 \copy。
COPY只能用于表,不能用于视图,不过可以用于COPY (SELECT * FROM viewname) TO ...
1、语法
--导出
COPY { table_name [ ( column_name [, ...] ) ] | ( query ) }
TO { 'filename' | PROGRAM 'command' | STDOUT }
[ [ WITH ] ( option [, ...] ) ]
--导入(如果导出的时候,指定了header属性,那么在导入的时候,也需要指定)
COPY table_name [ ( column_name [, ...] ) ]
FROM { 'filename' | PROGRAM 'command' | STDIN }
[ [ WITH ] ( option [, ...] ) ]
copy to的导出速度非常之快,经测试10W的数据量只需要3秒左右的时间。
COPY FROM能够识别下列特殊反斜杠字符:
2、常见用法
--服务端导出,导出到数据库所在服务器
copy t2 to '/data/pgbackup/t2.csv' with csv;
--导出指定属性
copy t2(name) to '/data/pgbackup/t2_name.csv' with csv;
copy (select * from t2) to '/data/pgbackup/t2_sel.csv' with csv;
--客户端导出,导出到psql命令所在服务器
\copy t2 to '/tmp/t2.dmp' 或者psql -c "copy t2 to stdout" > /tmp/t2.dmp
--如果导出的字段,有integer[]类型,直接导出,再导入的话,会有问题,解决办法是需要在导出的时候,进行处理
\COPY ( select coalesce(integer_array, '{}')::integer[] as integer_array from table ) TO '/tmp/data.csv' with csv header;
--使用escape或unicode模式输入特殊字符(例如TAB做分隔符)
\copy aa from '/tmp/aa.csv' with (delimiter U&'\0009')
\copy aa from '/tmp/aa.csv' with (delimiter E'\t')
四、pg_basebackup备份与恢复
1、基础备份
--postgresql.conf
# - Archiving -
wal_level = replica
archive_mode = on # enables archiving; off, on, or always
archive_command = 'test ! -f /data/pgarch/%f && cp %p /data/pgarch/%f;find /data/pgarch/ -type f -mtime +30 -exec rm -f {} \;'
--创建REPLICATION角色
CREATE ROLE replica login replication encrypted password 'replica@1234';
--配置pg_hba.conf,允许远程流式备份
echo "host replication replica 0.0.0.0/0 md5" >> pg_hba.conf
--模拟数据
create database pas_db with owner=hwb ENCODING='UTF8' TABLESPACE=pas_data connection limit=-1;
\c pas_db postgres
select pg_switch_wal();
create table t4(id int);
select pg_switch_wal();
insert into t4 values(1),(2),(3),(4);
select pg_switch_wal();
select current_timestamp;
-- 2020-12-14 16:13:23.10133+08
select pg_switch_wal();
insert into t4 values(5),(6),(7),(8);
--远程使用pg_basebackup备份
systemctl stop postgresql
rm -rf /data/pgdata/*
#-Fp表示以plain格式数据,-Xs表示以stream方式包含所需的WAL文件,-P表示显示进度,-R表示为replication写配置信息。
#备份完成,使用-R选项,在data目录下自动生成standby.signal“信号”文件(可手工使用touch命令生成)以及更新了postgresql.auto.conf文件
#postgresql.auto.conf中写入了主库的连接信息(可手工添加primary_conninfo信息)。
pg_basebackup --progress -D /data/pgdata -h xx.142 -p 55432 -U replica --password -Fp -Xs -P -R
2、恢复
--在data目录下创建一个空文件:
touch recovery.signal
--修改 postgresq.conf 文件把archive相关参数全部注释掉并增加两行:
restore_command = 'cp /data/pgarch/%f %p'
recovery_target_time = '2020-12-14 16:13:23.10133+08'
a.恢复到最新:
restore_command = 'cp /data/pgarch/%f %p'
recovery_target_timeline = 'latest'
b.恢复到指定的时间点:
restore_command = 'cp /data/pgarch/%f %p'
recovery_target_time = '2020-12-14 16:13:23.10133+08'
c.创建还原点:
SELECT pg_create_restore_point('restore_point1');
d.恢复到还原点:
restore_command = 'cp /data/pgarch/%f %p'
recovery_target_name ='restore_point1'
--启动数据库进行恢复
systemctl restart postgresql
五、PG快照备份与恢复
PostgreSQL有一个导出和导入事务快照的功能,这个功能在9.2版本开始支持,允许事务共享它当时的snapshot给其他的事务使用。
SET TRANSACTION SNAPSHOT命令允许新的事务使用与一个现有事务相同的快照运行。已经存 在的事务必须已经把它的快照用pg_export_snapshot函数导出。该函数会返回一个快照标识符,SET TRANSACTION SNAPSHOT需要被给定一个快照标识符来指定要导入的快照。
需要注意的是:只有事务是SERIALIZABLE以及 repeatable read时,DEFERRABLE 事务属性才会有效。
PostGreSQL采用“快照”方式来实现MVCC。具体地说,这意味着每一个事务中的查询仅能看到:
1)该事务启动之前已经提交的事务所作出的数据更改。
2)当前事务中该查询之前的查询所作出的更改。
下面基于事务隔离级别repeatable read进行测试
1、建表
create table test (id int);
insert into test values (1),(2);
--开启五个会话进行测试
2、session1:
begin TRANSACTION ISOLATION LEVEL repeatable read;
SELECT pg_export_snapshot(); --00000004-0000047B-1
insert into test values (3);
SELECT pg_export_snapshot(); --00000004-0000047B-2
select * from txid_current();
select * from txid_current_snapshot();
3、session2(插入一条新数据并提交):
insert into test values (4);
4、session3(能查看到会话2插入的数据):
select * from test;
5、session4 (导入s1的第一个snapshot, 因此看不到s2提交的数据) :
begin TRANSACTION ISOLATION LEVEL repeatable read;
SET TRANSACTION SNAPSHOT '00000004-0000047B-1';
select * from test;
select * from txid_current();
select * from txid_current_snapshot();
6、session5 (导入s1的第二个snapshot, 因此看不到s2提交的数据, 同时验证了看不到s1修改过的数据):
begin TRANSACTION ISOLATION LEVEL REPEATABLE READ;
SET TRANSACTION SNAPSHOT '00000004-0000047B-2';
select * from test;
select * from txid_current();
select * from txid_current_snapshot();
7、session1(提交):
8、session4 (s1提交后, 这个snapshot还存在, 只要还有导入了这个snapshot的事务存在着) :
select * from test;
9、session5 (s1提交后, 这个snapshot还存在, 只要还有导入了这个snapshot的事务存在着)
篇幅有限,基于时间点恢复的内容后面单独介绍吧,感兴趣的朋友可以关注下!
- 上一篇:C++各类知识点总结
- 下一篇:打通C和GO:CGO入门剖析与实践
相关推荐
- Jquery 详细用法
-
1、jQuery介绍(1)jQuery是什么?是一个js框架,其主要思想是利用jQuery提供的选择器查找要操作的节点,然后将找到的节点封装成一个jQuery对象。封装成jQuery对象的目的有...
- 前端开发79条知识点汇总
-
1.css禁用鼠标事件2.get/post的理解和他们之间的区别http超文本传输协议(HTTP)的设计目的是保证客户机与服务器之间的通信。HTTP的工作方式是客户机与服务器之间的请求-应答协议。...
- js基础面试题92-130道题目
-
92.说说你对作用域链的理解参考答案:作用域链的作用是保证执行环境里有权访问的变量和函数是有序的,作用域链的变量只能向上访问,变量访问到window对象即被终止,作用域链向下访问变量是不被允许的。...
- Web前端必备基础知识点,百万网友:牛逼
-
1、Web中的常见攻击方式1.SQL注入------常见的安全性问题。解决方案:前端页面需要校验用户的输入数据(限制用户输入的类型、范围、格式、长度),不能只靠后端去校验用户数据。一来可以提高后端处理...
- 事件——《JS高级程序设计》
-
一、事件流1.事件流描述的是从页面中接收事件的顺序2.事件冒泡(eventbubble):事件从开始时由最具体的元素(就是嵌套最深的那个节点)开始,逐级向上传播到较为不具体的节点(就是Docu...
- 前端开发中79条不可忽视的知识点汇总
-
过往一些不足的地方,通过博客,好好总结一下。1.css禁用鼠标事件...
- Chrome 开发工具之Network
-
经常会听到比如"为什么我的js代码没执行啊?","我明明发送了请求,为什么反应?","我这个网站怎么加载的这么慢?"这类的问题,那么问题既然存在,就需要去解决它,需要解决它,首先我们得找对导致问题的原...
- 轻量级 React.js 虚拟美化滚动条组件RScroll
-
前几天有给大家分享一个Vue自定义滚动条组件VScroll。今天再分享一个最新开发的ReactPC端模拟滚动条组件RScroll。...
- 一文解读JavaScript事件对象和表单对象
-
前言相信做网站对JavaScript再熟悉不过了,它是一门脚本语言,不同于Python的是,它是一门浏览器脚本语言,而Python则是服务器脚本语言,我们不光要会Python,还要会JavaScrip...
- Python函数参数黑科技:*args与**kwargs深度解析
-
90%的Python程序员不知道,可变参数设计竟能决定函数的灵活性和扩展性!掌握这些技巧,让你的函数适应任何场景!一、函数参数设计的三大进阶技巧...
- 深入理解Python3密码学:详解PyCrypto库加密、解密与数字签名
-
在现代计算领域,信息安全逐渐成为焦点话题。密码学,作为信息保护的关键技术之一,允许我们加密(保密)和解密(解密)数据。...
- 阿里Nacos惊爆安全漏洞,火速升级!(附修复建议)
-
前言好,我是threedr3am,我发现nacos最新版本1.4.1对于User-Agent绕过安全漏洞的serverIdentitykey-value修复机制,依然存在绕过问题,在nacos开启了...
- Python模块:zoneinfo时区支持详解
-
一、知识导图二、知识讲解(一)zoneinfo模块概述...
- Golang开发的一些注意事项(一)
-
1.channel关闭后读的问题当channel关闭之后再去读取它,虽然不会引发panic,但会直接得到零值,而且ok的值为false。packagemainimport"...
- Python鼠标与键盘自动化指南:从入门到进阶——键盘篇
-
`pynput`是一个用于控制和监控鼠标和键盘的Python库...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)