"); //-->
近期,源启混沌工程平台上线自动化实验防护、自动化案例生成、实验自动结果判定、AI智能根因分析等功能,并融合大模型,实现了自动化和智能化能力的进一步提升。
在国产化创新战略驱动下,金融等重点行业正在加速推进服务器、操作系统、数据库等核心业务系统的国产化进程。在广泛应用云计算、分布式等新技术的同时,如何在技术更迭过程中验证和保障系统的韧性,成为了行业的难点和痛点问题。通过近年来的技术探索与工程实践,混沌工程技术通过主动构模拟各类系统故障场景,并以实验的方式验证和增强系统韧性,已成为击破这一黑盒的关键路径。
在此背景下,源启混沌工程平台应运而生。平台立足于全栈国产化场景,自主研发了混沌工程技术工具,全面适配信创生态,实现从基础设施到应用层的自主安全。
源启混沌工程平台架构图
■ 优势1:丰富的故障场景
涵盖IaaS、PaaS、SaaS三个系统层级,支持容器、微服务组件的故障注入,支持脚本自定义故障、交易一致性等实验场景模拟。通过自主研发实现内核态故障模拟,平台可模拟硬件层面的故障场景,更加贴近真实生产故障。
■ 优势2:平台自动化能力
平台具备专家库、知识库功能,通过沉淀行业经典故障场景和实践案例汇总,形成包含部署架构、混沌实验设计、缺陷修复方案等关键要素的知识库。同时,平台内置故障设计方案,融入FMEA故障风险优先级计算模型、指标体系、标准案例集,实现了从架构感知、实验案例生成、实验编排、实验执行、结果评判到生成报告的实验全流程自动化运行。
■ 优势3:完备的实施方案
平台支持完整的混沌演练生命周期管控,配备工程实施制度流程体系、故障设计指南、开箱即用的混沌测试用例、运维红蓝对抗演练实施方案等功能,并与多家银行展开合作。
源启混沌工程平台登录页面
近期,通过持续的技术迭代与行业实践融合,源启混沌工程平台升级了多项自动化和智能化能力,可有效应对系统的稳定性风险,为国产化系统架构演进提供全生命周期的可靠性保障。
功能一:自动化实验防护
平台支持设置基线保护策略,支持在实验期间基于基线策略进行自动中止,以识别系统非稳态情况,从而防止故障在链路中失控蔓延,同时支持在触发自动中止后查看具体详情。
功能二:自动化案例生成
平台支持基于系统架构的拓扑关系自动生成批量故障实验。通过自动解析系统架构的类型、链路关系、节点属性等关键信息,平台可自动匹配相关原子故障,实现一键式批量故障实验的自动生成。
功能三:实验自动结果判定和AI智能根因分析
混沌工程实验的自动结果判定功能,支持用户在创建混沌工程实验时选择稳定性度量策略并设置度量规则。实验运行结束后,平台将根据规则对实验结果数据进行自动度量计算与分析,判定实验是否通过。
同时,源启混沌工程平台融合了AI大模型。在实验不通过时,平台会自动获取实验期间的结构化数据,并通过AI大模型给出实验结果的诊断结论及优化建议。
源启混沌工程平台的自动结果判定和AI智能根因分析能力,能显著减少人工收集和分析数据的工作量,进一步提高混沌工程实验效率,并避免了人工操作可能产生的失误。
产品介绍
源启混沌工程平台基于混沌工程系统故障模拟技术,深度融合自动化与智能化技术体系,主要应用于系统高可用测试及数据中心运维演练场景。平台通过主动注入系统性风险,可以有效发现系统中的薄弱环节,优化分布式架构,提高系统的健壮性,保障系统的稳定运行。助力企业系统国产化、分布式架构转型过程中的韧性建设。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。