【Docker 新手入门指南】第十五章:常见故障排除
ztj100 2025-07-21 19:11 48 浏览 0 评论
一、前期准备:收集关键信息
在排查问题前,建议先获取以下系统数据,便于精准定位故障:
1. 系统基础信息
# 查看 Docker 版本(确认是否为最新稳定版)
docker version
# 查看 Docker 系统配置(存储驱动、Cgroup 版本等)
docker info
# 查看 Docker 守护进程日志(定位守护进程启动异常)
journalctl -u docker.service -xe
2. 容器运行状态
# 列出所有容器(包括停止状态)
docker ps -a
# 查看容器实时日志(添加 --follow 追踪最新日志)
docker logs [容器ID/名称]
# 获取容器详细配置(网络、挂载、资源限制等)
docker inspect [容器ID/名称]
二、常见问题分类排查
1. 安装与初始化问题
典型症状:权限错误、守护进程启动失败、服务无法初始化
- 权限不足
# 将当前用户加入 docker 用户组(需重启终端生效)
sudo usermod -aG docker $USER newgrp docker # 立即生效权限变更
- 守护进程状态异常
# 检查服务状态(active/running 为正常)
sudo systemctl status docker # 重启/启动服务
sudo systemctl restart docker sudo systemctl enable --now docker # 开机自启并立即启动
- 依赖缺失(Linux 系统)
- Ubuntu/Debian:确保安装 apt-transport-https、ca-certificates、curl 等依赖
- CentOS:安装 yum-utils 并配置稳定仓库源
2. 网络连接问题
典型症状:容器无法联网、端口映射失效、跨容器通信失败
- 网络配置检查
# 查看默认网络(bridge 为默认网络)
docker network ls
# 检查容器所属网络配置(IP、DNS、网关)
docker network inspect bridge
- 端口冲突
# 查看宿主机端口占用(替换 <端口号>)
sudo lsof -i :<端口号>
# 更换映射端口(例如将容器 80 端口映射到宿主机 8080)
docker run -p 8080:80 nginx
- DNS 解析失败
- 修改 Docker 守护进程配置(/etc/docker/daemon.json):
{
"dns": ["8.8.8.8", "8.8.4.4"] # 配置公共 DNS 服务器
}
- 重启 Docker 服务使配置生效
3. 存储与磁盘问题
典型症状:磁盘空间不足、数据卷挂载失败、镜像无法删除
- 清理无效资源
# 清理所有停止的容器、未使用的镜像和网络
docker system prune -a -f
# 查看磁盘占用详情(镜像/容器/数据卷分布)
docker system df
- 数据卷异常
# 列出所有数据卷
docker volume ls
# 检查数据卷挂载路径(宿主机路径是否存在)
docker volume inspect [卷名]
- 镜像残留清理
# 删除悬空镜像(无标签的临时镜像)
docker image prune -f
# 强制删除镜像(包含依赖标签)
docker rmi -f [镜像ID]
4. 性能与资源问题
典型症状:容器卡顿、CPU/内存占用过高、宿主机性能下降
- 资源监控
# 实时监控容器资源(CPU/内存/网络/IO)
docker stats [容器ID/名称]
# 查看容器内进程(排查异常进程)
docker top [容器ID/名称]
- 资源限制配置
# 限制 CPU(0.5 核)和内存(512MB)
docker run -d --cpus="0.5" --memory=512m nginx
# 限制磁盘 IO(示例:读写速率 10MB/s)
docker run -d --device-read-bps=/dev/sda:10mb --device-write-bps=/dev/sda:10mb myapp
5. 镜像构建与拉取问题
典型症状:镜像拉取超时、构建失败、镜像标签错误
- 仓库连接问题
# 登录私有仓库(检查账号密码是否正确)
docker login [仓库地址]
# 使用镜像加速器(国内推荐腾讯云/阿里云镜像)
sudo nano /etc/docker/daemon.json
{
"registry-mirrors": ["https://mirror.ccs.tencentyun.com"]
}
- Dockerfile 构建错误
- 检查构建上下文路径(避免包含无关文件)
- 添加 --no-cache 跳过缓存重新构建:
docker build --no-cache -t myapp .
- 通过 docker build --progress=plain 查看详细构建日志
6. 安全与权限问题
典型症状:容器以 root 运行、镜像存在漏洞、访问控制失效
- 非 root 用户运行容器
# 指定 UID/GID 运行(需镜像支持非 root 用户)
docker run -d --user 1001:1001 nginx
- 漏洞扫描与修复
# 使用 Docker Scan 扫描镜像漏洞(需先安装 Trivy)
docker scan [镜像名]:[标签]
# 查看镜像敏感配置(如特权模式)
docker inspect --format='{{.HostConfig.Privileged}}' [镜像ID]
三、常见错误代码与解决方案
错误信息 | 可能原因 | 解决方法 |
Error response from daemon: conflict | 容器名称冲突 | docker rm [冲突容器名] 或指定新名称 |
port is already allocated | 端口被占用 | 更换端口或终止占用进程 |
OCI runtime create failed | 内核参数不支持 | 检查 Cgroup 驱动(docker info 确认) |
manifest unknown | 镜像不存在或标签错误 | 确认镜像名/标签是否正确,重新拉取 |
driver failed programming external connectivity | 防火墙或网络配置错误 | 关闭防火墙或配置 iptables 规则 |
四、最佳实践与维护建议
预防措施
- 定期备份:对重要数据卷和 docker-compose.yml 进行版本控制
- 资源隔离:使用 docker-compose 管理多容器应用,配置 cpu_shares/memory 限制
- 版本管理:固定镜像标签(如 nginx:1.23-alpine),避免使用 latest 标签
日常维护
# 每周清理无效资源
docker system prune -a -f --volumes
# 每月更新 Docker 和镜像
sudo apt update && sudo apt upgrade docker-ce
docker pull --all-tags nginx # 强制更新所有标签镜像
日志管理
- 配置日志驱动(如 json-file 或接入 ELK 系统):
{
"log-driver": "json-file",
"log-opts": {
"max-size": "10m",
"max-file": "3"
}
}
相关推荐
- Linux集群自动化监控系统Zabbix集群搭建到实战
-
自动化监控系统...
- systemd是什么如何使用_systemd/system
-
systemd是什么如何使用简介Systemd是一个在现代Linux发行版中广泛使用的系统和服务管理器。它负责启动系统并管理系统中运行的服务和进程。使用管理服务systemd可以用来启动、停止、...
- Linux服务器日常巡检脚本分享_linux服务器监控脚本
-
Linux系统日常巡检脚本,巡检内容包含了,磁盘,...
- 7,MySQL管理员用户管理_mysql 管理员用户
-
一、首次设置密码1.初始化时设置(推荐)mysqld--initialize--user=mysql--datadir=/data/3306/data--basedir=/usr/local...
- Python数据库编程教程:第 1 章 数据库基础与 Python 连接入门
-
1.1数据库的核心概念在开始Python数据库编程之前,我们需要先理解几个核心概念。数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它就像一个电子化的文件柜,能让我们高效...
- Linux自定义开机自启动服务脚本_linux添加开机自启动脚本
-
设置WGCloud开机自动启动服务init.d目录下新建脚本在/etc/rc.d/init.d新建启动脚本wgcloudstart.sh,内容如下...
- linux系统启动流程和服务管理,带你进去系统的世界
-
Linux启动流程Rhel6启动过程:开机自检bios-->MBR引导-->GRUB菜单-->加载内核-->init进程初始化Rhel7启动过程:开机自检BIOS-->M...
- CentOS7系统如何修改主机名_centos更改主机名称
-
请关注本头条号,每天坚持更新原创干货技术文章。如需学习视频,请在微信搜索公众号“智传网优”直接开始自助视频学习1.前言本文将讲解CentOS7系统如何修改主机名。...
- 前端工程师需要熟悉的Linux服务器(SSH 终端操作)指令
-
在Linux服务器管理中,SSH(SecureShell)是远程操作的核心工具。以下是SSH终端操作的常用命令和技巧,涵盖连接、文件操作、系统管理等场景:一、SSH连接服务器1.基本连接...
- Linux开机自启服务完全指南:3步搞定系统服务管理器配置
-
为什么需要配置开机自启?想象一下:电商服务器重启后,MySQL和Nginx没自动启动,整个网站瘫痪!这就是为什么开机自启是Linux运维的必备技能。自启服务能确保核心程序在系统启动时自动运行,避免人工...
- Kubernetes 高可用(HA)集群部署指南
-
Kubernetes高可用(HA)集群部署指南本指南涵盖从概念理解、架构选择,到kubeadm高可用部署、生产优化、监控备份和运维的全流程,适用于希望搭建稳定、生产级Kubernetes集群...
- Linux项目开发,你必须了解Systemd服务!
-
1.Systemd简介...
- Linux系统systemd服务管理工具使用技巧
-
简介:在Linux系统里,systemd就像是所有进程的“源头”,它可是系统中PID值为1的进程哟。systemd其实是一堆工具的组合,它的作用可不止是启动操作系统这么简单,像后台服务...
- Linux下NetworkManager和network的和平共处
-
简介我们在使用CentoOS系统时偶尔会遇到配置都正确但network启动不了的问题,这问题经常是由NetworkManager引起的,关闭NetworkManage并取消开机启动network就能正...
你 发表评论:
欢迎- 一周热门
-
-
MySQL中这14个小玩意,让人眼前一亮!
-
旗舰机新标杆 OPPO Find X2系列正式发布 售价5499元起
-
面试官:使用int类型做加减操作,是线程安全吗
-
C++编程知识:ToString()字符串转换你用正确了吗?
-
【Spring Boot】WebSocket 的 6 种集成方式
-
PyTorch 深度学习实战(26):多目标强化学习Multi-Objective RL
-
Linux下NetworkManager和network的和平共处
-
Kubernetes 高可用(HA)集群部署指南
-
7,MySQL管理员用户管理_mysql 管理员用户
-
linux系统启动流程和服务管理,带你进去系统的世界
-
- 最近发表
-
- Linux集群自动化监控系统Zabbix集群搭建到实战
- systemd是什么如何使用_systemd/system
- Linux服务器日常巡检脚本分享_linux服务器监控脚本
- 7,MySQL管理员用户管理_mysql 管理员用户
- Python数据库编程教程:第 1 章 数据库基础与 Python 连接入门
- Linux自定义开机自启动服务脚本_linux添加开机自启动脚本
- linux系统启动流程和服务管理,带你进去系统的世界
- CentOS7系统如何修改主机名_centos更改主机名称
- 前端工程师需要熟悉的Linux服务器(SSH 终端操作)指令
- Linux开机自启服务完全指南:3步搞定系统服务管理器配置
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)