CNCF技术监督委员会(TOC)已投票决定接受Chaos Mesh作为CNCF孵化项目。
Chaos Mesh最初是开源分布式数据库TiDB测试平台是一个多功能混沌工程平台Kubernetes协调环境中的混沌实验。它有助于识别潜在的故障点,并确保Kubernetes能承受意外破坏的基础设施。
2020年7月被接受CNCF沙盒以来,Chaos Mesh已经实现了两个主要版本(v1.0和v2.0)和30个次要版本大大提高了可观察性、功能和安全性。一些突出的功能包括。
- 通过网络用户界面管理和监控混沌实验,可视化辅助工具混沌仪表盘。
- 本地工作流引擎用于定义混沌场景,管理混沌实验组和应用程序的状态检查。
- 混沌模拟更强大、更全面,涵盖StressChaos、DNSChaos、JVMChaos、AWSChaos、GCPChaos、HTTPChaos等。
- 基于Kubernetes RBAC授权机制的权限策略。
已经采用了50多个组织Chaos Mesh测试和提高其分布式系统的弹性。采用者包括ByteDance、DataStax、Percona、Prudential、NetEase Fuxi、RabbitMQ、SHAREit、XPeng Motors等。此外,微软Azure Chaos Studio等待云供应商已经到来Chaos Mesh整合到他们身上SaaS在解决方案中,允许用户注入故障AKS集群中。这些公司的许多人也在回馈这个项目。
"Chaos Mesh建立在Kubernetes CRD上,这让项目有了先机,"网易福喜高级质量保证工程师张辉说。"它为细粒度的混沌提供了统一的支UI--混沌仪表盘,增强可观察性,控制混沌范围准确。这些都是由一个开放、合作、充满活力的社区推动的。"
"Chaos Mesh为基础设施团队提前验证高可用性、网络流量损失、双向同步等场景提供了丰富的故障模拟方法,有助于挖掘解决方案的缺陷,降低风险,"XPeng Motors首席工程师Hengliang Tan说。"它还可以帮助我们的团队降低测试成本"。
"我们建立Chaos Mesh使命很简单——让混沌工程更容易,让复杂的系统更有弹性,因为它们应该是这样的,"Chaos Mesh维护者和共同创造者Cwen Yin说。"社区和生态系统的力量对实现这一目标至关重要。我们很高兴看到Chaos Mesh成为孵化项目。CNCF它是云原生态系统的驱动力。在社区的支持和指导下,它将帮助我们进一步发展Chaos工程。"
Chaos Mesh采用Kubernetes架构,使用Kubernetes CustomResourceDefinitions(CRD)定义混沌对象。它还可以与其他云原生项目(如Argo、Grafana和Prometheus)紧密集成,使混沌体验更加管理、定制和观察。
- 。Chaos Mesh可视化组件。Chaos Dashboard提供了一套用户友好的网络界面,用户可以通过它来操作和观察Chaos实验。
- 。Chaos Mesh核心逻辑组件。Chaos Controller Manager主要负责调度管理Chaos实验。
- 主要执行组件。Chaos Daemon在DaemonSet在模式下运行,默认拥有Privileged权限(可以禁用)。
- :一个用于向非Kubernetes将故障工具包注入节点。
- 4.5K GitHub星级
- 1.3K 提交量
- 800多个已关闭的问题
- 来自60多个组织的125名贡献者
- 32次发布
- 50多个采用者
"CNCF首席技术官Chris Aniszczyk说:"没有一个云原生部署是完美的——失败总会发生,所以利用混沌工程建立一种灵活的文化,可以为组织节省时间和金钱。"我们期待着看到混沌网作为孵化项目如何成长,影响混沌和弹性工程领域的状况。"
Chaos Mesh有一个完整的路线图,团队正在积极增加新的特性和功能,改善整个混乱体验。为了提高易用性和可观察性,团队正在努力提供高效的状态验证机制和报告能力。工作流引擎的持续优化将使用户能够通过Chaos Mesh实现完整的混沌工程周期。为了尽可能覆盖云原生系统中的许多实际故障,丰富支持的故障类型将提高功能和可扩展性。此外,该团队还将提供一个插件机制,允许用户自由扩展故障类型,并将插件和混乱场景发布到Chaos Mesh上。作为一个CNCF托管项目,Chaos Mesh它是中立基金会的一部分,与其技术利益一致,也更大Linux后者提供管理、营销支持和社区推广。Chaos Mesh加入孵化技术Argo, Buildpacks, CloudEvents, CNI, Contour, Cortex, CRI-O, Dragonfly, emissary-ingress, Falco, Flux, gRPC, KEDA, KubeEdge, NATS, Notary, OpenTelemetry, Operator Framework, Rook, SPIFFE, SPIRE, and Thanos, 请访问各级成熟度要求CNCF毕业标准。