岗位描述
我们正在构建面向未来的 AI 全生命周期开发平台,覆盖从模型训练、推理到智能体(Agent)开发的一站式工程体系。如果你对 AI 技术演进充满热情,希望参与打造支撑大规模 AI 应用的底层平台,欢迎加入我们!
你将深度参与 AI 开发平台的核心能力建设,围绕 “AI 资产 + AI 算力 + AI 模型” 三大核心要素,推动AI平台在架构设计、系统研发和工程落地等方面的持续创新,具体包括:
1.平台基础能力研发
负责 AI 开发平台的账号体系、权限控制、资源调度与服务治理等核心模块的迭代与优化,保障多租户场景下的安全、性能和稳定性。
2.运维体系建设
构建可扩展的平台运维体系,涵盖系统巡检、变更管理、故障预警与智能运维(AIOps),提升平台稳定性与可观测性。
3.多环境部署架构设计
针对客户多样化的基础设施环境(公有云、私有化、混合部署),设计灵活、兼容性强的部署方案,并推动标准化落地。
4.高可用与弹性架构实现
设计并落地平台级的高可用、容灾与弹性伸缩能力,支持业务高峰期的稳定运行与快速扩容。