企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
算法工程师-大模型工程化
接单
收藏职位
分享职位
35-50万
北京
本科
3-5年
招聘 3 人
预计佣金
58.5K
2天前发布
迅致直营
反馈快
72小时新发
职位亮点
反馈快、回款快
JD基本信息
岗位职责
1.负责将大模型(LDM)能力转化为稳定、高效、可扩展的生产级服务,构建高并发、低延迟、资源高效的 AI 推理服务。 2.推动从算法原型到生产系统的全链路工程化落地,交付高质量、可维护、高可靠的服务代码。 3.设计并实现大模型推理 API 服务,深入优化推理任务调度; 4.实现流式响应(Streaming)、批处理推理、动态负载均衡等复杂场景。 5.深入理解 Python,推动算法工程化与服务标准化 6.将模型推理流程封装为可复用、参数化、版本化的 Python 服务模块,实现“一次开发、多端复用”,降低算法工程师接入成本,推动 AI 能力“服务化、工具化、平台化”。 7.深入理解 Python 原理(如对象模型、GC 机制、字节码执行),能够应用 C 扩展开发(Cython/PyBind11)等方式提升关键模块性能; 8.具备系统性优化能力,优化模型加载、内存映射、GPU 显存管理,提升资源利用率,持续改进大模型推理性能; 9.编写清晰的技术文档、API 手册和运维手册,确保系统可维护。
任职要求
1.4 年以上 Python 后端开发经验,精通 Python 运行机制与底层原理(GIL、对象生命周期、GC 策略、字节码执行、多线程/协程调度),熟悉pytorch tensorflow等深度学习框架,理解机器学习,人工智能算法; 2.具备卓越的工程交付能力:能独立负责模块设计、代码实现、测试覆盖、上线运维全过程,交付高质量、可维护、可扩展的生产系统; 3.深度掌握 FastAPI / Starlette 异步框架,能独立优化中间件、依赖注入、请求生命周期与并发瓶颈; 4.有大模型推理服务(vLLM / TGI / Transformers + Hugging Face)的生产落地经验,熟悉模型加载、量化、缓存、批处理等关键技术; 加分项: 有 C/C++ 扩展开发经验(Cython / PyBind11),能优化关键路径性能; 熟悉 MLOps 工具链(MLflow、Weights & Biases、DVC)、模型注册与版本管理;
所属行业:
计算机软件
职能分类:
算法工程师
工作城市:
北京,招聘3人,详细地址:北京市海淀区中关村丹棱SOHO
职位要求
学历要求:
本科·统招
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
35-50万*15薪
薪资福利:
五险一金、当地人力引进政策
团队架构
所属部门:
销售部
下属人数:
-
部门架构:
无
汇报对象:
部门经理
职级职称:
无
面试信息
面试轮次:
4轮
面试流程:
初面(业务部门)- 领导评价 - 高层面试 - HR
视频面试:
可以接受
举报