上海市资深数据工程师（抗体序列大数据）招聘-禾蛙,猎头合作交易平台

**********************

资深数据工程师（抗体序列大数据）

收藏职位

分享职位

50-119万上海不限不限招聘 1 人预计佣金 145.1K 08:21刷新/一个月前发布

反馈快

JD基本信息

岗位职责

1. 生物大数据ETL体系建设负责亿级抗体序列、蛋白序列、突变库、实验湿数据的采集、清洗、归一、融合、结构化ETL全流程；处理TB级海量生物数据，搭建稳定、自动化、可迭代的数据处理流水线。 2. 生物序列质控体系搭建建立抗体/蛋白序列专属质控标准：冗余过滤、异常序列剔除、CDR区校验、长度过滤、低质量噪点过滤、突变合理性校验等；形成可自动化运行的质控规则库，保障训练数据高质量、高纯度。 3. 生物数据标注体系规范建设牵头设计并落地抗体序列结构化标注体系，统一字段规范、语义规范、实验属性标注、结构属性标注、亲和力/稳定性标签体系；建立标注流程、标注SOP、质检复核机制，支撑模型高质量训练。 4. 数据集版本管理与数据资产建设搭建生物数据集版本管理、溯源、分层管理体系，支持增量更新、版本回滚、数据分级、权限管理；构建公司标准化抗体数据资产库，为持续迭代大模型提供稳定数据源。 5. 自动化Pipeline工程化落地独立搭建可复用、自动化、周期性运行的生物数据处理Pipeline，实现数据清洗、质控、标注、打包、出集自动化，大幅降低算法同学前置数据工作量，提升模型迭代效率。 6. 数据迭代与业务支撑对接算法研发、抗体研发实验团队，根据模型训练反馈、湿实验结果持续优化数据规则、扩充高质量数据集、优化数据分布，提升模型泛化能力与预测精度。

任职要求

1. 计算机、数据工程、生物信息、计算生物等相关专业，本科及以上，3年以上大数据/生物数据工程经验。 2. 具备TB级海量数据、亿级样本规模数据实战处理经验，有蛋白/抗体/基因序列数据处理经验优先。 3. 有完整生物数据Pipeline搭建经验，熟练完成数据自动化清洗、归一、质控、结构化出集全链路。 4. 熟悉生物序列数据质控逻辑、标注体系设计、数据集版本管理、数据分层治理，懂AI训练数据需求。 5. 工程能力扎实：熟练 Python、数据并行处理、批量调度、数据脚本工程化，熟悉大数据工具栈。 6. 具备极强的数据标准化、体系化思维，能够从0到1搭建生物数据基建，减少算法侧重复造轮子。

所属行业:

生物技术、化学药、其他行业

职能分类:

数据分析师

工作城市:

上海，招聘1人，详细地址：浦东张江

职位要求

学历要求:

不限

工作年限:

不限

技能/证书:

薪资福利

年薪范围:

50-119万*15薪

薪资福利:

团队架构

所属部门:

下属人数:

部门架构:

汇报对象:

职级职称:

面试信息

面试轮次:

面试流程:

视频面试:

不可以接受

职能类别

关于

联系我们

电话：400-777-5125（服务时间：工作日9:00至18:00）
网址：www.hewa.cn
地址：中国（上海）自由贸易试验区滨江大道99弄6号第11层

服务支持: 接单方小程序

发单方小程序

微信公众号