企业招聘
职位
关于禾蛙
合伙人计划
联系客服快速发单
扫码添加企业微信
客服电话
400-7777-5125
猎企入驻
400-777-5125
免费注册
登录
**********************
资深数据工程师(抗体序列大数据)
接单
收藏职位
分享职位
50-119万
上海
不限
不限
招聘 1 人
预计佣金
145.1K
05:39刷新/一周前发布
JD基本信息
岗位职责
1. 生物大数据ETL体系建设 负责亿级抗体序列、蛋白序列、突变库、实验湿数据的采集、清洗、归一、融合、结构化ETL全流程;处理TB级海量生物数据,搭建稳定、自动化、可迭代的数据处理流水线。 2. 生物序列质控体系搭建 建立抗体/蛋白序列专属质控标准:冗余过滤、异常序列剔除、CDR区校验、长度过滤、低质量噪点过滤、突变合理性校验等;形成可自动化运行的质控规则库,保障训练数据高质量、高纯度。 3. 生物数据标注体系规范建设 牵头设计并落地抗体序列结构化标注体系,统一字段规范、语义规范、实验属性标注、结构属性标注、亲和力/稳定性标签体系;建立标注流程、标注SOP、质检复核机制,支撑模型高质量训练。 4. 数据集版本管理与数据资产建设 搭建生物数据集版本管理、溯源、分层管理体系,支持增量更新、版本回滚、数据分级、权限管理;构建公司标准化抗体数据资产库,为持续迭代大模型提供稳定数据源。 5. 自动化Pipeline工程化落地 独立搭建可复用、自动化、周期性运行的生物数据处理Pipeline,实现数据清洗、质控、标注、打包、出集自动化,大幅降低算法同学前置数据工作量,提升模型迭代效率。 6. 数据迭代与业务支撑 对接算法研发、抗体研发实验团队,根据模型训练反馈、湿实验结果持续优化数据规则、扩充高质量数据集、优化数据分布,提升模型泛化能力与预测精度。
任职要求
1. 计算机、数据工程、生物信息、计算生物等相关专业,本科及以上,3年以上大数据/生物数据工程经验。 2. 具备TB级海量数据、亿级样本规模数据实战处理经验,有蛋白/抗体/基因序列数据处理经验优先。 3. 有完整生物数据Pipeline搭建经验,熟练完成数据自动化清洗、归一、质控、结构化出集全链路。 4. 熟悉生物序列数据质控逻辑、标注体系设计、数据集版本管理、数据分层治理,懂AI训练数据需求。 5. 工程能力扎实:熟练 Python、数据并行处理、批量调度、数据脚本工程化,熟悉大数据工具栈。 6. 具备极强的数据标准化、体系化思维,能够从0到1搭建生物数据基建,减少算法侧重复造轮子。
所属行业:
生物技术/生物工程、制药、医药外包、生物医药类其他
职能分类:
数据科学家
工作城市:
上海,招聘1人,详细地址:浦东张江
职位要求
学历要求:
不限
工作年限:
不限
技能/证书:
-
薪资福利
年薪范围:
50-119万*15薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
-
面试流程:
-
视频面试:
不可以接受
举报
为你推荐
职能类别
IT互联网技术
电子/通信/半导体
销售/客服
制药/医疗器械/医疗护理
高级管理
关于
禾蛙动态
合伙人计划
猎企入驻
帮助中心
禾蛙协议
禾蛙海外版
联系我们
电话:400-777-5125(服务时间:工作日9:00至18:00)
网址:www.hewa.cn
苏州地址:苏州工业园区星湖街328号创意产业园2-B405
北京地址:北京市朝阳区朝阳门南大街10号兆泰国际A座501
服务支持
接单方小程序
发单方小程序
微信公众号
©版权所有
苏州聚聘网络技术有限公司
苏公网安备32059002007268号
备案号:苏ICP备18067483号-3
|
营业执照
|
服务许可证