企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
LLM大语言模型部署优化工程师
接单
收藏职位
分享职位
50-60万
上海
研究生
3-5年
招聘 1 人
预计佣金
51.8K
1天前发布
迅致直营
72小时新发
JD基本信息
岗位职责
职位描述 1. 负责LLM大语言模型推理部署,以及模型服务化的工作,包括架构设计、开发和维护工作,完成模型发版交付; 2. 负责针对特定硬件环境(如云平台、边缘设备等)设计并实现高效的模型部署架构,支持大规模、高并发的在线推理服务,解决带宽和显存等瓶颈,实现推理性能优化; 2. 负责AI算法模型在不同平台上的工程化设计、实现与加速、系统集成与工程化落地; 3. 负责模型压缩和优化,熟悉模型量化、剪枝、蒸馏等优化加速方式; 5. 负责模型量化、推理、部署工具链的研发,探索和跟进不同深度学习推理加速框架;
任职要求
职位要求 1. 计算机科学、人工智能等相关领域硕士及以上学历; 2. 精通C/C++、Python,熟悉容器化技术和云计算平台,对高性能计算、分布式系统有深入了解; 3. 熟悉深度学习框架,如PyTorch、Tensorflow等; 4. 熟悉llama.cpp、vLLM、deepspeed、Megatron等大模型推理框架,有docker容器化部署经验; 5. 熟悉FlashAttention、XFormer、FasterTransformer等大模型推理加速方案。 6. 加分项:熟悉cuBLAS、OpenBLAS等高性能计算库,擅长自定义算子; 7. 良好的团队沟通能力、技术攻关能力,责任心强,具备一定抗压能力。
所属行业:
互联网金融、人工智能AI、计算机软件
职能分类:
机器学习
工作城市:
上海,招聘1人,详细地址:华宏商务中心五楼凌志软件,15号线长风公园
职位要求
学历要求:
研究生
工作年限:
3-5年
技能/证书:
-
薪资福利
年薪范围:
50-60万*15薪
薪资福利:
福利待遇:五险按实际工资标准缴纳,公积金按照7000元基数,餐补+交通补助:20元/天 合同签订:3年合同,6个月试用期,试用期不打折
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
3轮
面试流程:
1轮:产品总监 2轮:技术远程发题测试 3轮:副总裁
视频面试:
可以接受
举报