docker目前支持以下5种网络模式:
- bridge:此时docker引擎会创建一个veth对,一端连接到容器实例并命名为eth0,另一端连接到指定的网桥中(比如
docker0),因此同在一个主机的容器实例由于连接在同一个网桥中,它们能够互相通信。容器创建时还会自动创建一条SNAT规则,用于容器与外部通信时。如果用户使用了-p或者-Pe端口端口,还会创建对应的端口映射规则。 - host:与宿主机共享网络,此时容器没有使用网络的namespace,宿主机的所有设备,如Dbus会暴露到容器中,因此存在安全隐患。
- none:不设置网络,相当于容器内没有配置网卡,用户可以手动配置。
- container:指定与某个容器实例共享网络
- network:使用自定义网络,可以使用
docker network create创建,并且默认支持多种网络驱动,用户可以自由创建桥接网络或者overlay网络。
默认是桥接模式,网络地址为172.16.0.0/16,同一主机的容器实例能够通信,但不能跨主机通信。本文下面将介绍如何使用gre隧道技术实现跨主机通信。
环境配置#
本文使用两台主机A,B模拟实验,这两台主机其实是virtalbox虚拟机,操作系统为ubuntu14.04,均配置有两张网卡,网卡配置如下:
- eth0:与宿主机桥接,连接公网
- eth1:host only网卡,分配的ip地址为192.168.56.0/24,连接在同一个host only的网卡能够互相通信
其中A主机网络:
1
2
| eth0: 172.16.1.24(公司内网IP,能够通外网)
eth1: 192.168.56.4
|
B主机网络:
1
2
| eth0: 172.16.1.178(公司内网IP,能够通外网)
eth1: 192.168.56.5
|
两台主机需要安装以下软件包:
- Docker,实验时使用的最新版本1.11,快速安装:
1
| curl -sSL https://get.docker.com/ | sh
|
1
| sudo apt-get install openvswitch-switch
|
- bridge-utils,也可以不安装,使用
ovs-vsctl。
Docker配置#
两台主机的容器能够通信,不能出现网络重叠,因此设置不同的网络:
1
2
| A: 10.103.100.0/24
B: 10.103.200.0/24
|
并且为了加速镜像拉取,使用灵雀云镜像。最后A主机配置文件/etc/default/docker如下:
1
| DOCKER_OPTS="$DOCKER_OPTS --registry-mirror=http://houchaohann.m.alauda.cn --bip=10.103.100.1/24 --fixed-cidr=10.103.100.0/24"
|
B主机配置文件/etc/default/docker如下:
1
| DOCKER_OPTS="$DOCKER_OPTS --registry-mirror=http://houchaohann.m.alauda.cn --bip=10.103.200.1/24 --fixed-cidr=10.103.200.0/24"
|
分别重启A、B主机Docker服务:
1
| sudo service docker restart
|
此时A主机docker0网桥地址为10.103.100.1,B主机docker0网桥地址为10.103.200.1。
在A主机上ping 10.103.200.1显然不通,同理B主机ping不通A主机网桥。
隧道配置#
在A主机上创建一个网桥(使用ovs-vsctl,不要使用brctl):
1
| sudo ovs-vsctl add-br docker_tunnel
|
将gre0接口加入到网桥docker_tunnel, 创建一个GRE隧道添加到网桥中并配置远端IP,注意:我们在eth1之上建立隧道,因此需要使用eth1 IP地址:
1
| sudo ovs-vsctl add-port docker_tunnel gre0 -- set Interface gre0 type=gre options:remote_ip=192.168.56.5
|
此时:
1
2
3
4
5
6
7
8
9
10
11
| fgp@ubuntu-4:~$ sudo ovs-vsctl show
2189345f-d4fb-4915-ab97-4c65a8d9ffe0
Bridge docker_tunnel
Port "gre0"
Interface "gre0"
type: gre
options: {remote_ip="192.168.56.5"}
Port docker_tunnel
Interface docker_tunnel
type: internal
ovs_version: "2.0.2"
|
把docker_tunnel加入到docker0网桥中:
1
| sudo brctl addif docker0 docker_tunnel
|
增加路由:
1
| sudo ip route add 10.103.200.0/24 via 192.168.56.5 dev eth1
|
此时路由表:
1
2
3
4
5
6
7
8
| fgp@ubuntu-4:~$ sudo route -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
0.0.0.0 172.16.1.1 0.0.0.0 UG 0 0 0 eth0
10.103.100.0 0.0.0.0 255.255.255.0 U 0 0 0 docker0
10.103.200.0 192.168.56.5 255.255.255.0 UG 0 0 0 eth1
172.16.1.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0
192.168.56.0 0.0.0.0 255.255.255.0 U 0 0 0 eth1
|
验证A主机是否能和B通信:
1
2
3
4
5
6
7
| fgp@ubuntu-4:~$ ping -c 2 -w 1 10.103.200.1
PING 10.103.200.1 (10.103.200.1) 56(84) bytes of data.
64 bytes from 10.103.200.1: icmp_seq=1 ttl=64 time=0.339 ms
--- 10.103.200.1 ping statistics ---
1 packets transmitted, 1 received, 0% packet loss, time 0ms
rtt min/avg/max/mdev = 0.339/0.339/0.339/0.000 ms
|
同样在B主机执行相同步骤:
1
2
3
4
| sudo ovs-vsctl add-br docker_tunnel
sudo ovs-vsctl add-port docker_tunnel gre0 -- set Interface gre0 type=gre options:remote_ip=192.168.56.4
sudo brctl addif docker0 docker_tunnel
sudo ip route add 10.103.100.0/24 via 192.168.56.4 dev eth1
|
验证B主机是否能够和A通信:
1
2
3
4
5
6
7
8
| fgp@ubuntu-5:~$ ping -c 2 -w 1 10.103.100.1
PING 10.103.100.1 (10.103.100.1) 56(84) bytes of data.
64 bytes from 10.103.100.1: icmp_seq=1 ttl=64 time=0.336 ms
64 bytes from 10.103.100.1: icmp_seq=2 ttl=64 time=0.409 ms
--- 10.103.100.1 ping statistics ---
2 packets transmitted, 2 received, 0% packet loss, time 999ms
rtt min/avg/max/mdev = 0.336/0.372/0.409/0.041 ms
|
验证docker容器跨主机通信#
A主机创建ubuntu14.04容器:
1
| docker run -t -i --rm --name from-A --hostname from-A ubuntu:14.04 bash
|
在容器内部查看ip地址:
1
2
3
| # from-A
ifconfig eth0 | grep 'inet addr' | cut -d ':' -f 2 | cut -d ' ' -f 1
# 10.103.100.2
|
B主机创建ubuntu14.04容器:
1
| docker run -t -i --rm --name from-A --hostname from-B ubuntu:14.04 bash
|
在容器内部查看地址:
1
2
3
| # from-B
ifconfig eth0 | grep 'inet addr' | cut -d ':' -f 2 | cut -d ' ' -f 1
# 10.103.200.2
|
在A容器实例上ping B容器实例:
1
2
| # from-A
ping 10.103.200.2
|
输出:
1
2
3
4
5
6
7
| root@from-A:/# ping -c 2 -w 1 10.103.200.2
PING 10.103.200.2 (10.103.200.2) 56(84) bytes of data.
64 bytes from 10.103.200.2: icmp_seq=1 ttl=62 time=0.510 ms
--- 10.103.200.2 ping statistics ---
1 packets transmitted, 1 received, 0% packet loss, time 0ms
rtt min/avg/max/mdev = 0.510/0.510/0.510/0.000 ms
|
我们发现,在主机A的容器成功ping通主机B的容器,实现了跨主机通信!
使用docker-swarm实现跨主机容器通信#
docker的overlay的网络驱动支持跨主机通信,这个实现在libnetwork中基于内置的VXLAN实现以及docker的libkv库。使用overlay网络需要依赖K-V Store,目前支持的K-V Store包括etcd、Consul、Zookeeper。
本来想直接使用docker启动consul的,后来发现docker daemon启动依赖consul,因此只能先按照consul。首先到官方下载安装包:下载地址,解压缩后,只有一个二进制文件,直接运行即可:
1
| nohup ./consul agent -dev -advertise 172.16.1.24 -client 0.0.0.0 &
|
注意: 该服务在A机器上运行,172.16.1.24务必配成能够连接外网的IP地址,否则后面启动Swarm容器时内部无法通信!
然后修改A、B服务的daemon配置文件/etc/default/docker:
1
2
| DOCKER_OPTS="--cluster-store=consul://172.16.1.24:8500 --cluster-advertise=eth0:2375"
DOCKER_OPTS="$DOCKER_OPTS --registry-mirror=http://houchaohann.m.alauda.cn -H tcp://0.0.0.0:2375 -H unix:///var/run/docker.sock"
|
重启docker服务:
1
| sudo service docker restart
|
执行docker info必须包含以下信息:
1
2
| Cluster store: consul://172.16.1.24:8500
Cluster advertise: 172.16.1.24:2375
|
接着我们需要部署Docker Swarm集群,详细过程参考手动部署docker-swarm集群。
最后创建overlay网络:
1
| docker network create --driver overlay --subnet 10.103.240.0/24 test
|
其中--dirver指定为overlay,并指定我们需要的子网地址,名称为test,通过docker network ls可以检查我们创建的网络是否成功:
1
2
| fgp@ubuntu-5:~$ docker network ls | grep test
7eef808f272b test overlay
|
此时overlay网络创建完毕。我们测试其是否支持跨主机通信,首先我们创建一个ubuntu容器,命名为ubuntu-1,并使用我们刚刚创建的网络:
1
| docker run -t -i -d --net test --name ubuntu-1 ubuntu:14.04
|
接着我们创建第一个ubuntu容器,此时为了保证它不和ubuntu-1调度在同一台主机上,我们需要使用docker swarm的filter,指定affinity,如下:
1
| docker run -t -i -d --net test --name ubuntu-2 -e affinity:container!=~ubuntu-1 ubuntu:14.04
|
运行docker ps:
1
2
3
4
5
| docker ps
fgp@ubuntu-5:~$ docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
ba5018dfe26e ubuntu:14.04 "/bin/bash" 2 minutes ago Up Less than a second ubuntu-5/ubuntu-1
bedd266cddaa ubuntu:14.04 "/bin/bash" 14 hours ago Up 41 seconds ubuntu-4/ubuntu-2
|
由此可知,两个ubuntu容器运行在不同的主机上,符合我们的测试要求。分别获取ubuntu-1和ubuntu-2的ip地址:
1
2
3
4
| fgp@ubuntu-5:~$ docker inspect -f '{{.NetworkSettings.Networks.test.IPAddress}}' ubuntu-1
10.103.240.2
fgp@ubuntu-5:~$ docker inspect -f '{{.NetworkSettings.Networks.test.IPAddress}}' ubuntu-2
10.103.240.3
|
可见ubuntu-1的ip地址为10.103.240.2,ubuntu-2的ip地址为10.103.240.3,我们在ubuntu-1上ping ubuntu-2地址:
1
2
3
4
5
6
7
8
| fgp@ubuntu-5:~$ docker exec -t -i ubuntu-1 ping -c 2 10.103.240.3
PING 10.103.240.3 (10.103.240.3) 56(84) bytes of data.
64 bytes from 10.103.240.3: icmp_seq=1 ttl=64 time=0.559 ms
64 bytes from 10.103.240.3: icmp_seq=2 ttl=64 time=0.661 ms
--- 10.103.240.3 ping statistics ---
2 packets transmitted, 2 received, 0% packet loss, time 999ms
rtt min/avg/max/mdev = 0.559/0.610/0.661/0.051 ms
|
结果发现,不在同一主机的ubuntu-1和ubuntu-2能够正常通信!