1、高速网络技术的设计和研发,满足 AI/大模型业务在训练、推理、存储等多个场景对网络的需求;
2、支持大规模 AI 场景的高速网络平台系统研发,包括故障定位和性能分析等;
3、高性能 AI 通信框架,网络协议栈以及端网应用协同优化等核心技术的研发,在支持业务规模化扩展的同时,保证网络的高可靠性和高性能;
4、通过技术创新推动 AI 网络技术的持续演进,打造适合大规模 AI 场景的超低时延高速互联技术。
任职要求
1、精通计算机网络和网络编程;
2、精通至少一门主流编程语言,比如 C/C++, Python, Go 等;
3、熟悉当前高性能网络和系统领域的最新进展,包括 RDMA,拥塞控制,AI 网络优化等技术;
4、对 AI 网络故障定位和性能优化有经验者优先;
5、有高性能通信框架(如 NCCL,MPI,各种 RPC 库等)开发经验者优先。