帮助蝴蝶效应重构、迁移和优化E2B基础设施(AlAgent)平台

2025-07-02

Help Butterfly Effect

帮助蝴蝶效应重构、迁移和优化E2B基础设施(AlAgent)平台

关于客户

蝴蝶效应是一家专注于AI智能体技术的中国创业公司,其核心产品Manus是一个通用人工智能智能体平台。Manus Agent及相关系统基于E2B框架开发和构建。由于E2B目前仅提供基于GCP的部署方案,客户在使用过程中遇到了多项技术挑战和业务痛点。为解决这些问题并提升系统性能,客户需要将E2B基础设施平台重构并迁移至AWS云环境。

客户痛点

E2B基础设施层改造工作量大、难度高:云服务商API差异、资源映射复杂性、网络架构差异等问题需要重写自动化脚本,并使用CICD技术栈提高应用部署自动化水平,降低长期维护成本

E2B系统架构改造复杂且难以维护:官方Orchestrator、envd、Template-manager、API、Docker-reverse-proxy、Session-proxy、client-proxy等服务在GCP上遇到高并发时稳定性较差,客户团队难以有效掌握

GCP环境稳定性差:在GCP环境中遇到D-state问题,客户急需能够进行沙箱热迁移的解决方案,以避免系统中断

解决方案

E2B Infra平台采用AWS北弗吉尼亚区域的多层云原生架构,通过CloudFormation/Terraform/Packer构建基础设施,部署跨双可用区的三层网络(公有/私有/数据库子网),使用Nomad编排服务集群并配置ALB负载均衡和Auto Scaling弹性伸缩,数据层采用多AZ RDS PostgreSQL和ElastiCache Redis。同时集成CloudFront CDN和Datadog+Loki+Grafana+OpenTelemetry全链路监控系统,实现高可用可扩展的企业级平台架构。

架构图

沙箱热迁移方案:
基于对客户业务场景的深入分析,设计并实现了完整的沙箱热迁移方案。该方案有效解决了客户在业务连续性方面的核心痛点,确保迁移过程中业务的稳定性,同时显著提升用户体验和服务质量

灵活的自动扩缩容方案:
基于AWS ASG实现更智能的容量管理,系统可根据负载自动扩缩容,更从容地应对流量波动,实现显著的成本优化效果

扩缩容架构

项目成果

  1. 研发和运维效率显著提升:客户可以专注于AI智能体的核心业务开发,无需投入精力应对底层基础设施的复杂性。通过自动化部署、智能运维工具和实时监控告警平台,开发周期缩短40%以上,运维效率提升50%以上,显著降低技术门槛和维护成本
  2. 业务连续性全面保障:构建多区域容灾架构,实现业务7×24小时不间断运行。提供热迁移能力,彻底解决GCP环境中的D-state问题,配备7×24小时专业技术支持团队,确保业务稳定可靠
  3. 卓越的高并发处理能力:支持大规模并发沙箱创建,轻松应对AI应用的突发流量需求
  4. 性能显著提升:改造后的沙箱在创建、暂停、恢复等核心操作上均优于原GCP环境,为用户提供更流畅的体验

关于神州泰岳

北京神州泰岳软件股份有限公司(简称"神州泰岳")成立于2001年,是国内首批创业板上市公司(股票代码:300002)。神州泰岳坚持"互相尊重、值得信任、成就他人"核心价值观和"创新驱动、全球布局"发展战略,立志成为有持续创新能力的数字经济领军企业,打造行业精品,支撑客户提升,推动产业发展。

神州泰岳一直专注于提供亚马逊云科技专业的顾问咨询服务与技术支持服务,其中包括了云咨询、迁移、账单服务、CDN服务、云托管服务以及企业出海服务等。并且针对制造、媒体、游戏、电商等行业提供专业的解决方案,以交付价值的理念为客户提供优质服务。

返回客户案例