Velero 系列文章(五):基于 Velero 的 Kubernetes 集群备份容灾生产最佳实践
本文最后更新于:2024年7月24日 晚上
考量维度 | 基于 CSI 快照 | 基于 Restic 文件复制 |
---|---|---|
应用性能影响 | 低,CSI 接口调用存储系统快照 | 取决于数据量,占用额外资源 |
数据可用性 | 依赖于存储系统 | 对象存储和生产环境隔离,独立可用性,支持跨站点可用性 |
数据一致性 | 支持 Crash Consistency,配合 hook 机制实现一致性 | 无保障,基于 hook |
最佳实践
高频本地快照 + 低频 restic 备份到 s3
从应用角度选择合适的备份粒度和备份策略
多集群环境中共享同一对象存储时要防止冲突
坑
删除长时间未完成的备份或恢复任务,会导致 velero 阻塞无法处理后续任务
QA
velero 快照和企业存储提供的快照 (比如 netapp) 的对比?
答:相比企业级快照,Velero 是可以从应用角度来实现做快照;
另外备份到 s3 的话,可以通过 hook 实现一致性。
推荐的一种最佳实践: 先做快照,然后凌晨 后台 把快照做 s3 数据的复制。
系列文章
📚️参考文档
Velero 系列文章(五):基于 Velero 的 Kubernetes 集群备份容灾生产最佳实践
https://ewhisper.cn/posts/22436/