K8S学习,你需要掌握的知识!
1、K8S命令概述
在学习K8s基础命令前,了解和学习docker命令是很有必要的,kubectl和docker很多命令都有相通之处。
2、K8S集群资源操作
集群资源查看查看配置
查看是否有资源限制
.168.1.2Capacity:
cpu: 16ephemeral-storage: 524030980Ki
hugepages-1Gi: 0 hugepages-2Mi: 0memory: 82320508Ki
pods: 253Allocatable:
cpu: 15100m
ephemeral-storage: 520373252Ki
hugepages-1Gi: 0 hugepages-2Mi: 0memory: 79101052Ki
pods: 2531.2.3.4.5.6.7.8.9.10.11.12.13.14.capacity代表减去系统预留的资源总量。
Allocatable可分配给K8S资源的总量。
pod资源限制,防止单个服务占用资源过高影响其他pod,达到limits数值后会oom重启。
resources
resources:
limits:
cpu: "5"memory: 5000Mi
requests:
cpu: 55m
memory: 100Mikubectl --help 多用help1.2.3.4.5.6.7.8.3、K8S运维场景
副本扩容通过副本扩容实现流量分摊,避免单个节点负载过高,建议资源中增加反亲和性,达到不同副本调度到不同node
指定名字空间
kubectl exec nginx-965048598-jt28d -n test uptime #不进入容器,只获取命令输出1.2.3.还可以通过kubectl scale命令将副本缩为0的方式删除pod
pod污点对于设置了污点的服务,普通pod无法调用到此节点,只有增加了Tolerations容忍配置才可以。
Taints:
kubectl taint node 192.168.0.1 test-access-node=:NoSchedule --overwrite=true #污点添加kubectl taint node 192.168.0.1 test-access-node:NoSchedule- #污点删除1.2.3.4.其中[effect] 可取值:
NoSchedule :一定不能被调度(新来的不要来,在这的就别动了)
PreferNoSchedule:尽量不要调度(尽量不要来,除非没办法)
NoExecute:不仅不会调度,还会驱逐Node上已有的Pod
pod文件拷贝静态pod 是由 kubelet 管理的,只在特定node上存在的pod;静态pod总是由kubelet创建的,并且只在kubelet所在的Node上运行。静态pod 不能通过 api-server来管理,无法和 RC,RS,Deployment或者 DaemonSet进行关联;并且 kubelet无法对静态pod 进行健康检查。
静态pod资源文件默认存放路径/etc/kubernetes/manifests,也可以直接查看kubelet启动参数staticPodPath: /etc/kubernetes/manifests配置确定。
4、K8S问题定位
处理K8S环境问题,首先要了解pod的生命周期和pod的状态
常见状态原因
ImagePullBackOff 镜像拉取失败,网络不通,镜像名称有误或者镜像仓库认证失败都可能有这个报错。CrashLoopBackOff 探针检测失败,服务对网络或者其他pod服务有依赖等,此外宿主机上的安全软件可能也会导致容器无法正常启动。Pending 一般是调度失败,pod没有可调度的节点,常见原因:节点有污点,不满足节点亲和性,或者节点处于notready状态。Evicted 当节点内存、磁盘或者cpu资源不足时,K8s 会按照 QoS 等级对节点上的某些 Pod 进行驱逐,释放资源保证节点可用性,kubelet可以配置内存,cpu和磁盘的驱逐阈值。Terminating pod删除后超过terminationGracePeriodSeconds参数时间还处于Terminating状态可能是存在节点故障,和master节点失联,可以检查节点状态或者尝试重启kubeletCompleted 此状态通常是job类的pod执行完成了正常退出容器。Init:Error pod初始化失败,可以查看init pod的日志定位。问题定位经常需要使用如下命令:
podname
kubectl logs -f -l app=nginx-test #多副本情况下,可以看到所有pod日志kubectl describe pods podname #pod启动日志kubectl describe node 192.168.0.1 #节点状态日志kubectl get events #查看集群事件系统服务查看
systemctl status kubelet/docker/etcd
系统服务日志查看
journalctl -xeukubelet/docker
--since指定时间1.2.3.4.5.6.7.8.9.10.