分享web开发知识

注册/登录|最近发布|今日推荐

主页 IT知识网页技术软件开发前端开发代码编程运营维护技术分享教程案例
当前位置:首页 > 教程案例

kubernetes redis pod CrashLoopBackOff修复心得

发布时间:2023-09-06 02:30责任编辑:彭小芳关键词:rediskubernetes
前言

实验环境的kubernetes服务器物理机突然断电,重启后helm 部署的harbor出现了启动故障,首先查看harbor 相关容器运行状态:

解决方法

前面两个CrashLoopBackOff的容器,可以的使用命令删除容器,就可以解决,关键的是redis 容器,删除是解决不了的。

使用命令查看容器的日志。

[root@master ~]# kubectl logs hub-redis-master-0 Bad file format reading the append only file: make a backup of your AOF file, then use ./redis-check-aof --fix <filename>

简单理解:文件格式损坏,做个备份,使用命令修复。

关键问题是pod启动不起来,不能直接进去修复,所以关键问题还是让redis的容器启动起来,想让pod起来就必须不让容器加载之前的appendonly.aof文件,找到appendonly.aof重命名,让redis容器重新生成appendonly.aof。

查找appendonly.aof

接着查看容器的描述:

# kubectl describe po hub-redis-master-0 


可以获取到需要的信息:

/bitnami/redis/data ??#aof在容器上的路径Volumes: ??#redis pod的pvc信息 ?redis-data: ???Type: ??????PersistentVolumeClaim (a reference to a PersistentVolumeClaim in the same namespace) ???ClaimName: ?redis-data-hub-redis-master-0

确认redis 容器使用的 pv,获取pv的创建信息:

[root@master ~]# kubectl get pv | grep redispv006 ?????100Gi ?????RWO ???????????Recycle ?????????Bound ????default/redis-data-hub-redis-master-0 [root@master ~]# kubectl describe pv pv006Name: ???????????pv006Labels: ?????????<none>Annotations: ????kubectl.kubernetes.io/last-applied-configuration={"apiVersion":"v1","kind":"PersistentVolume","metadata":{"annotations":{},"name":"pv006","namespace":""},"spec":{"accessModes":["ReadWriteOnce"],"capac... ????????????????pv.kubernetes.io/bound-by-controller=yesFinalizers: ?????[kubernetes.io/pv-protection]StorageClass: ???Status: ?????????BoundClaim: ??????????default/redis-data-hub-redis-master-0Reclaim Policy: ?RecycleAccess Modes: ???RWOCapacity: ???????100GiNode Affinity: ??<none>Message: ????????Source: ???Type: ?????NFS (an NFS mount that lasts the lifetime of a pod) ???Server: ???192.168.2.4 ???Path: ?????/volume1/harbor/nfs6 ???ReadOnly: ?falseEvents: ???????<none>

这里可以找到nfs对应的路径,直接进入nfs服务器对应路径下重命名appendonly.aof,redis的pod就立即启动状态为running了,接下来就是修复appendonly.aof。

修复appendonly.aof

进入到容器:

[root@master ~]# kubectl exec -it hub-redis-master-0 bashI have no name!@hub-redis-master-0:/$ ls /bitnami/redis/data/appendonly.aof ?????appendonly.bak.aof ?dump.rdb ???????????

修复

redis-check-aof --fix /bitnami/redis/data/appendonly.bak.aof0x ??????????10f69: Expected prefix ‘*‘, got: ‘AOF analyzed: size=10316900, ok_up_to=69481, diff=10247419This will shrink the AOF from 10316900 bytes, with 10247419 bytes, to 69481 bytesContinue? [y/N]: ySuccessfully truncated AOF

现在就可以把正在使用的appendonly.aof 重命名,把修复后的aof命名为appendonly.aof ,删除容器,kubernetes自动重新创建redis容器,如果其它容器还是CrashLoopBackOff,这可能是redis没有启动导致的,redis修复好后,删除CrashLoopBackOff的容器,kubernetes自动重新建立就可以了。

kubernetes redis pod CrashLoopBackOff修复心得

原文地址:http://blog.51cto.com/m51cto/2344375

知识推荐

我的编程学习网——分享web前端后端开发技术知识。 垃圾信息处理邮箱 tousu563@163.com 网站地图
icp备案号 闽ICP备2023006418号-8 不良信息举报平台 互联网安全管理备案 Copyright 2023 www.wodecom.cn All Rights Reserved