0%

前段时间有朋友问我如何在 kubernetes 里搭建监控系统,恰好在公司也在维护内部的可观测平台,正好借这个机会整理下目前常见的自建监控方案。

一个完整的监控系统通常包含以下的内容:

  • 指标暴露:将系统内部需要关注的指标暴露出去
  • 指标采集:收集并存储暴露出来的指标
  • 指标展示:以各种图表展示和分析收集到的数据
  • 监控告警:当某些关键指标在一定时间周期内出现异常时,可以及时通知相关人员

image.png

对于 k8s 的监控通常分为两个部分:

  • k8s 自带的系统组建
  • 业务 Pod 暴露出来的监控指标
Read more »

安装 Istio

最近这段时间一直在做服务网格(Istio)相关的工作,背景是我们准备自建 Istio,首先第一件事情就是要安装。

我这里直接使用官网推荐的 istioctl 进行安装:

1
2
3
4
5
6
7
8
9
10
11
12
$ cat <<EOF > ./my-config.yaml
apiVersion: install.istio.io/v1alpha1
kind: IstioOperator
metadata:
namespace: istio-1-18-5
spec:
profile: minimal
revision: istio-1-18-5
meshConfig:
accessLogFile: /dev/stdout
EOF
$ istioctl install -f my-config.yaml -n istio-1-18-5

这里我使用的 profile 是 minimal,它只会安装核心的控制面,具体差异见下图:
image.png

Read more »

今天在 HackNews 上看到一个帖子:你们是否很难回忆起在工作中做了哪些贡献?

我觉得挺多人都有类似的问题,通常都是在需要面试或者内部晋升的时候才开始思考这些问题,这时候在想的话难免会有遗漏。

结合帖子里的回答我整理了以下以下方法。

Read more »

前言

之前在公司主要负责可观测性和 Pulsar 消息队列相关的内容,最近系统比较稳定,只需要做日常运维,所以就抽出时间逐步在接触 OLAP 相关的技术栈。

我们用的是 StarRocks,也是目前比较流行的 OLAP 数据库;在接触的这段时间以来,让我越发感觉到选对一个靠谱的技术方向的重要性。

Read more »

image.png
今天收到球友的问题,让推荐一些值得看的开源项目,觉得 netty 这些太复杂了不太好上手。

确实如此,我们日常常用的 Spring、Netty 确实由于发展了多年,看起来比较头大。

下面我来推荐一些我看过同时觉得不错的项目(几乎都是我参与过的),由易到难,其中也会包含 Java 和 Go 的项目,包含主流的中间件和云原生项目。

Read more »

前段时间给 StarRocks 的物化视图新增了一个特性,那也是我第一次接触 StarRocks,因为完全不熟悉这个数据库,所以很多东西都是从头开始了解概念。

为了能顺利的新增这个特性(具体内容可以见后文),我需要把整个物化视图的流程串联一遍,于是便有了这篇文章。

在开始之前简单了解下物化视图的基本概念:

image.png

简单来说,视图和 MySQL 这类传统数据库的概念类似,也是用于解决大量消耗性能的 SQL 的,可以提前将这些数据查询好然后放在一张单独的表中,这样再查询的时候性能消耗就比较低了。

Read more »

背景

最近在排查 starrocks 线上的一个告警日志:

每隔一段时间都会打印 base-table 也就是物化视图的基表被删除了,但其实表还在,也没人去删除;我们就怀疑是否真的表被删除了(可能是 bug)。

与此同时还有物化视图 inactive 的日志,也怀疑如果视图是 inactive 之后会导致业务使用有问题。

为了确认这个日志是否对使用影响,就得需要搞清楚它出现的原因;于是我就着手从日志打印的地方开始排查。

Read more »

前几天排查了一个业务接口执行高延迟的问题,也挺有参考意义的,分享一下排查过程。

现象是业务反馈有一个接口业务逻辑其实很简单,但是调用一次耗时,如下图所示:

Read more »