Docker处理常见问题

原文作者
一、Docker迁移存储目录
- 问题起因
- - 添加软链接
  - [解决方案2]变更docker配置文件
- 注意事项
二、Docker设备空间不足
- [问题起因1]
- - [解决方案]
- [问题起因二]
- - [解决方案1]变更docker启动配置文件
  - [解决方案2]变更systemctl的docker启动文件
- [问题原因3]
- - [解决方案]
三、Docker缺乏共享链接库
- [问题原因]
- - 解决办法
四、Docker 容器文件损坏
- [问题原因]
- - [解决方案]
五、Docker优雅的服务重启
- [问题原因]
- - [解决方案]
六、Docker不能删除容器
- [问题原因]
- - [解决方案]
七、Docker中文容器异常
- [问题原因]
- - [解决方案]
八、Docker容器网络互通
- [问题起因]
- - [解决方案]
九、Docker容器总线错误
- [问题原因]
- - [解决方案1]
  - [解决方案2]
十、Docker NFS挂载报错
- [问题原因]
- - 解决办法
十一、Docker使用默认网段
- [问题原因]
- - [解决方案]
十二、Docker服务启动串台
- [问题原因]
- - [解决方案]
十三、Docker命令调用报错
- [问题原因]
- - [解决方案]
十四、Docker 常规任务异常
- [问题原因]
- - [解决方案]
十五、Docker 引号用于变量
- [问题原因]
- - [解决方案]
十六、Docker删除镜像报错
- [问题起因]
- - [解决方案]
十七、Docker切换普通用户
- [问题原因]
- - [解决方案]
十八、Docker绑定到IPv6上
- [问题原因]
- - [解决方法]
十九、Docker超时启动容器
- [问题原因]
- - [解决方案]
二十、Docker限制端口网络
- [问题原因]
- - [解决方案]
二十一、Docker无法获得镜像
- [问题原因]
- - [解决方案]
二十二、Docker 不退出容器
- [问题原因]
- - [解决方案]
二十三、Docker 默认网段不使用
- [问题原因]
- - [解决方案]
二十四、Docker 增加私有仓库
- [问题原因]
- - [解决方案]

原文作者

一、Docker迁移存储目录

默认情况系统将进行docker容器存在/var/lib/docker目录下

问题起因

今天，通过监控系统，我发现公司其中一台服务器的磁盘速度很快。我立刻上去看了看，发现/var/lib/docker这个目录特别大。由于上述原因，我们都知道/var/lib/docker存储在相关容器中，因此不能随意删除。
然后准备迁移docker存储目录，或对/var扩容设备达到同样的目的。更多关于dockerd详情请点击查看官方文档。
但需要注意的是，尽量不要使用软连接，因为有些docker例如，我们熟悉的容器编排系统不支持这样做k8s就在内。/li>

#发现容器启动不了了
ERROR:cannot create temporary directory!

#查看系统存储情况
$ du -h --max-depth=1

[解决方法1]添加软链接

# 1、停止docker服务
$ sudo systemctl stop docker

# 2、开始迁移目录
$ sudo mv /var/lib/docker /data/

# 3、添加软链接
$ sudo ln -s /data/docker /var/lib/docker

# 4、启动docker服务
$ sudo systemctl start docekr

[解决方法2]改动docker配置文件

# [方式1] 改动docker启动配置文件
$ sudo vim /lib/systemd/system/docker.service
ExecStart=/usr/bin/dockerd --graph=/data/docker/

# [方式2] 改动docker启动配置文件
$ sudo vim /etc/docker/daemon.json
{ 
        
    "live-restore": true,
    "graph": [ "/data/docker" ]
}

注意事项

在迁移docker目录的时候注意使用的命令，要么使用mv命令直接移动，要么使用cp命令复制文件，但是需要注意同时复制文件权限和对应属性，不然在使用的时候可能会存在权限问题。如果容器中，也是使用root用户，则不会存在该问题，但是也是需要按照正确的操作来迁移目录。

# 使用mv命令
$ sudo mv /var/lib/docker /data/docker

#使用cp命令
$ sudo cp -arv /data/docekr /data2/docker

下图中，就是因为启动的容器使用的是普通用户运行进程的，且在运行当中需要使用/tmp目录，结果提示没有权限。在我们导入容器镜像的时候，其实是会将容器启动时需要的各个目录的权限和属性都赋予了。如果我们直接是cp命令单纯复制文件内容的话，就会出现属性不一致的情况，同时还会有一定的安全问题。

二、Docker设备空间不足

Increase Docker container size from defualt 10GB on rhel7.

[问题起因一]

容器在导入或者启动的时候，如果提示磁盘空间不足的，那么多半是还真的因为物理磁盘空间真的有问题导致的。如下图所示，我们可以看到/分区确实满了。

# 查看物理磁盘空间
$ df -Th
Filesystem    Size    Used    Avail    Use%    Mounted on
/dev/vda1      40G     40G       0G    100%    /
tmpfs         7.8G       0     7.8G      0%    /dev/shm
/dev/vdb1     493G    289G     179G     62%    /mnt

如果发现真的是物理磁盘空间满了的话，就需要查看到底是什么占据了如此大的空间，导致因为容器没有空间无法启动。其中，docker自带的命令就是一个很好的能够帮助我们发现问题的工具。

# 查看基本信息
# 硬件驱动使用的是devicemapper，空间池为docker-252
# 磁盘可用容量仅剩16.78MB，可用供我们使用
$ docker info
Containers: 1
Images: 28
Storage Driver: devicemapper
 Pool Name: docker-252:1-787932-pool
 Pool Blocksize: 65.54 kB
 Backing Filesystem: extfs
 Data file: /dev/loop0
 Metadata file: /dev/loop1
 Data Space Used: 1.225 GB
 Data Space Total: 107.4 GB
 Data Space Available: 16.78 MB
 Metadata Space Used: 2.073 MB
 Metadata Space Total: 2.147 GB

[解决办法]

通过查看系统，我们知道正是因为docker可用的磁盘空间不足，所以导致启动的时候没有足够的空间进行加载启动镜像。解决的办法也很简单，第一就是清理无效数据文件释放磁盘空间(清除日志)，第二就是修改docker数据存路径(大分区)。

# 显示哪些容器目录具有最大的日志文件
$ du -d1 -h /var/lib/docker/containers | sort -h

# 清除您选择的容器日志文件内容
$ cat /dev/null > /var/lib/docker/containers/container_id/container_log_name

[问题起因二]

显然我遇到的不是上一种情况，而是在启动容器的时候，容器启动之后不久就显示unhealthy的状态，通过如下日志发现，原来是复制配置文件启动的时候，提示磁盘空间不足。
后面发现是因为CentOS7 的系统使用的docker容器默认的创建大小就是10G而已，然而我们使用的容器却超过了这个限制，导致无法启动时提示空间不足。

2019-08-16 11:11:15,816 INFO spawned: 'app-demo' with pid 835
2019-08-16 11:11:16,268 INFO exited: app (exit status 1; not expected)
2019-08-16 11:11:17,270 INFO gave up: app entered FATAL state, too many start retries too quickly
cp: cannot create regular file '/etc/supervisor/conf.d/grpc-app-demo.conf': No space left on device
cp: cannot create regular file '/etc/supervisor/conf.d/grpc-app-demo.conf': No space left on device
cp: cannot create regular file '/etc/supervisor/conf.d/grpc-app-demo.conf': No space left on device
cp: cannot create regular file '/etc/supervisor/conf.d/grpc-app-demo.conf': No space left on device

[解决办法1]改动docker启动配置文件

# /etc/docker/daemon.json
{ 
        
    "live-restore": true
    "storage-opt": [ "dm.basesize=20G" ] 
}

[解决办法2]改动systemctl的docker启动文件

# 1、 停止docker服务
$ sudo systemctl stop docker

# 2、删除已存在的容器
$ sudo rm -rf /var/lib/docker

# 3、修改docker服务的文件
$ sudo vim /usr/lib/systemd/system/docker.service

# 4、找到启动参数行
ExecStart=/usr/bin/dockerd
修改为
ExecStart=/usr/bin/dockerd --storage-opt dm.basesize=20G

# 5、重启docker服务
$ sudo systemctl daemon-reload
$ sudo systemctl start docker

[问题起因三]

还有一种情况也会让容器无法启动，并提示磁盘空间不足，但是使用命令查看插线并不是因为物理磁盘真的不足导致的。而是，因为对于分区inode节点数满了导致的。

# 报错信息
No space left on device

[解决方法]

因为ext3文件系统使用inode table存储inode信息，而xfs文件系统使用B+ tree来进行存储。考虑到性能问题，默认情况下这个B+tree只会使用前1TB空间，当这1TB被写满后，就会导致无法写入inode信息，报磁盘空间不足的错误。我们可以在mount时，指定inode64即可将这个B+ tree使用的空间扩展到整个文件系统。

补充知识文件存储在硬盘上，硬盘的最小存储单位叫做扇区(Sector)。每个扇区存储512字节(相当于0.5KB)。操作系统读取硬盘的时候，不会一个个扇区地去读取，这样效率太低，而是一次性连续读取多个扇区，即一次性读取一个块(block)。这种由多个扇区组成的块，是文件存取的最小单位。块的大小，最常见的是4KB，即连续八个sector组成一个block块。文件数据都存储在块中，那么很显然，我们还必须找打一个地方存储文件的元信息，比如，文件的创建者、文件的创建日期、文件的大小等等。这种存储文件元信息的区域就叫做索引节点(inode)。每个文件都有对应的inode，里面包含了除了文件名以外的所有文件信息。 inode也会消耗硬盘空间，所以硬盘格式化的时候，操作系统自动将硬盘分为两个区域。一个数据区，存放文件的数据；另一个是inode区(inode table)，存放inode所包含的信息。每个inode节点的大熊啊，一般是128字节或256字节。inode节点的总数，在格式化时就给定，一般是每1KB或每2KB就设置一个inode节点。

# 每个节点信息的内容
$ stat check_port_live.sh
  File: check_port_live.sh
  Size: 225           Blocks: 8          IO Block: 4096   regular file
Device: 822h/2082d    Inode: 99621663    Links: 1
Access: (0755/-rwxr-xr-x)  Uid: ( 1006/  escape)   Gid: ( 1006/  escape)
Access: 2019-07-29 14:59:59.498076903 +0800
Modify: 2019-07-29 14:59:59.498076903 +0800
Change: 2019-07-29 23:20:27.834866649 +0800
 Birth: -

# 磁盘的inode使用情况
$ df -i
Filesystem                 Inodes   IUsed     IFree IUse% Mounted on
udev                     16478355     801  16477554    1% /dev
tmpfs                    16487639    2521  16485118    1% /run
/dev/sdc2               244162560 4788436 239374124    2% /
tmpfs                    16487639       5  16487634    1% /dev/shm

三、Docker缺共享链接库

Docker命令需要对/tmp目录下面有访问权限

编号	参数	解释说明
1	-i/-interactive	即使没有附加也保持 STDIN 打开；如果你需要执行命令则需要开启这个选项
2	-t/–tty	分配一个伪终端进行执行；一个连接用户的终端与容器 stdin 和 stdout 的桥梁

Docker常见问题处理

Docker处理常见问题

最近热搜

历史搜索 清除历史记录

历史搜索清除历史记录