StarRocks 物化视图创建与刷新全流程解析

最近在为 StarRocks 的物化视图增加多表达式支持的能力，于是便把物化视图（MV）的创建刷新流程完成的捋了一遍。

之前也写过一篇：StarRocks 物化视图刷新流程和原理，主要分析了刷新的流程，以及刷新的条件。

这次从头开始，从 MV 的创建开始来看看 StarRocks 是如何管理物化视图的。

创建物化视图

CREATE
MATERIALIZED VIEW mv_test99
REFRESH ASYNC EVERY(INTERVAL 60 MINUTE)
PARTITION BY p_time
PROPERTIES (
"partition_refresh_number" = "1"
)
AS
select date_trunc("day", a.datekey) as p_time, sum(a.v1) as value
from par_tbl1 a
group by p_time, a.item_id

创建物化视图的时候首先会进入这个函数：com.starrocks.sql.analyzer.MaterializedViewAnalyzer.MaterializedViewAnalyzerVisitor#visitCreateMaterializedViewStatement

其实就是将我们的创建语句结构化为一个 CreateMaterializedViewStatement 对象，这个过程是使用 ANTLR 实现的。

这个函数负责对创建物化视图的 SQL 语句进行语义分析、和基本的校验。

比如：

分区表达式是否正确
基表、数据库这些的格是否正确

校验分区分区表达式的各种信息。

然后会进入函数：com.starrocks.server.LocalMetastore#createMaterializedView()

这个函数的主要作用如下：

检查数据库和物化视图是否存在。
初始化物化视图的基本信息：
- 获取物化视图的列定义（schema）
- 验证列定义的合法性
- 初始化物化视图的属性（如分区信息）。
处理刷新策略：
- 根据刷新类型（如 ASYNC、SYNC、MANUAL 或 INCREMENTAL）设置刷新方案。
- 对于异步刷新，设置刷新间隔、开始时间等，并进行参数校验。
创建物化视图对象：
- 根据运行模式（存算分离和存算一体）创建不同类型的物化视图对象
- 设置物化视图的索引、排序键、注释、基础表信息等。
处理分区逻辑：
- 如果物化视图是非分区的，创建单一分区并设置相关属性。
- 如果是分区的，解析分区表达式并生成分区映射关系
绑定存储卷：
- 如果物化视图是云原生类型，绑定存储卷。