故障记录

故障记录

Jan
03
解决Msys2终端报"Unable to use a TTY"错误

解决Msys2终端报"Unable to use a TTY"错误

环境 OS:Windows 10 MSYS2 20230718 问题描述 使用kubectl来操作Kubernetes集群一切,唯一的错误就是进入到某个容器里面报"Unable to use a TTY": $ kubectl -n <ns&
1 min read
Aug
26
调整Elasticsearch存储使用比例

调整Elasticsearch存储使用比例

环境 Elasticsearch版本:7.10.2 问题现象 Elasticsearch所在的节点磁盘空间达到一定的水位时,会自动触发规则,这些规则可能会影响我们的业务。主要以下默认的配置参数影响: cluster.routing.allocation.disk.threshold_enabled: true cluster.routing.allocation.
2 min read
Mar
03
Prometheus exporter 连接mysql报密码错误

Prometheus exporter 连接mysql报密码错误

环境 mysql版本: 5.7.28 mysql_exporter 版本: 1.3.1 过程 创建mysql账号 CREATE USER 'exporter'@'localhost' IDENTIFIED BY 'PGAMDv0qhyHj1QSxQnJh'
3 min read
Nov
23
解决CNI报failed to find plugin "bridge" in path [/opt/cni/bin]错误

解决CNI报failed to find plugin "bridge" in path [/opt/cni/bin]错误

在部署 Kubernates 集群时,CoreDNS 的Pod始终处于**"ContainerCreating"**状态,正如下所示: # k get pod -n kube-system NAME READY STATUS RESTARTS AGE coredns-546565776c-8rtm4 0/
2 min read
Aug
22
Kubernetes 1.20+  NFS Provisioner 无法正常使用

Kubernetes 1.20+ NFS Provisioner 无法正常使用

问题描述 在使用**Kubernetes 1.20+**部署NFS Provisioner时,会发现在创建PersistentVolumeClaim 时状态始终为Pending,并抛出以下异常: unexpected error getting claim reference: selfLink was empty, can't make
3 min read
Jul
03
Jenkins git克隆代码时出现"Timeout"错误

Jenkins git克隆代码时出现"Timeout"错误

构建项目时开发哥哥反馈有任务构建失败,构建了3个任务,有1个任务是失败的--重试了也是如此,于是查看了这几个仓库,发现除了代码仓库的容量大小不一致外,并无二致--任务失败的代码仓库容量比较大,已经接近1G的大小了。 同时从Jenkins任务的Console Output有如下报错信息: +refs/heads/*:refs/remotes/origin/* # timeout=10 ERROR: Error cloning remote
2 min read
Jun
27
java容器无法使用jmap命令

java容器无法使用jmap命令

jmap是java一个常用的辅助工具,它可以输出所有内存中对象,来检查内存泄漏等问题,然而在容器里使用jmap命令时,会遇到以下错误: / # ps -ef PID USER TIME COMMAND 1 root 1h30 java -jar /app-salary.jar --sahara.config.
2 min read
Sep
05
SUSE-Linux-Enterprise 启动提示“Failed to switch root”

SUSE-Linux-Enterprise 启动提示“Failed to switch root”

环境 OS: SUSE Linux Enterprise 12 SP3 Kernel:4.4.180-94.97 起因 一台Azure的云主机,重启系统,便无法启动,卡在以下画面。 排查 查看报告文件: cat
2 min read
Jul
31
安装ESXi-6.7 U3 停留在loading /bnxtroce.v00

安装ESXi-6.7 U3 停留在loading /bnxtroce.v00

环境 OS: ESXi-6.7U3 服务器:华为RH2288 v3 设备皆为新购,将官方下载的ISO系统写入U盘中进行引导安装,发现一直卡在“loading/bnxtroce.v00” 中。于是Google查阅资料,解决方法如下: U盘的写入方式(软碟通或Rufus)为 USB-ZIP+
1 min read
Feb
15
如何解决在初始化kubernetes集群时无法访问gcr.io?

如何解决在初始化kubernetes集群时无法访问gcr.io?

国内网络比较特殊化,无法直接访问gcr.io,这导致了我们在正常初始化kubernetes集群时会失败--kubernetes在使用kubeadm工具时会自动拉取gcr.io上面的docker镜像。这时我们需要通过一些特殊的手段来解决该问题。 方法一、镜像替换法 顾名思义,就是从别的地方下载集群所需要的docker镜像,然后将这些镜像tag标记成gcr.io镜像,这样在集群初始化时的镜像依赖就可以得到解决。 查看集群环境需要镜像列表 $ sudo kubeadm config images list k8s.
3 min read