**********************
数据处理工程师
  • 收藏职位
  • 分享职位
18-30万 合肥 研究生 0-3年 招聘 1 人 预计佣金 5.4K 1天前发布
72小时新发 外包
职位亮点
RPO模式客户直签合同
JD基本信息
岗位职责
1.负责大模型预训练数据的清洗、去噪与结构化处理,构建高质量语料库,支持模型训练需求。 2.设计并实现基于Python的高效数据处理Pipeline,优化数据预处理流程,提升数据质量。 3.擅长对接数据采集(上游)与模型训练(下游),制定数据规范、质量监控及闭环优化策略,确保数据-模型高效协同。 加分项: 1.编程能力 a. 熟练掌握Python语言,熟练使用正则表达式,掌握面向对象编程及类的继承等,有html,json等数据处理经验。 b. 熟练掌握Linux,能够自主进行conda环境配置与依赖管理,擅长使用grep/awk/sed等命令进行文本处理。 c. 具备NLP实战经验,熟悉中文分词技术,掌握文本分类模型训练流程及调优方法,有实际项目经验 2.加分项 a. 熟悉lxml,BeautifulSoup等技术,有一定的爬虫经验。 b. 熟悉DeepSeek、通义千问等国产大模型的选型、量化、推理加速及ollama部署,具备Prompt工程和RAG优化等垂直领域适配经验。 c. 熟练部署并优化开源工具,掌握容器化封装、性能调优及生产级落地能力,确保高效稳定服务于业务场景。 d. 有spark分布式和并发数据处理经验;
任职要求
任职资格: 1.硕士及以上学历,计算机、数据科学、人工智能相关专业。 2.1-3年以上数据清洗/处理经验,有LLM或NLP项目经验者优先。 3.具备良好的数据敏感度,能独立解决复杂数据问题。 4.强烈的责任心与团队协作能力,适应快节奏技术迭代。
所属行业:
人工智能AI
职能分类:
数据采集
工作城市:
合肥,招聘1人,详细地址:合肥蜀山区安徽飞数信息科技有限公司中安创谷二期K5栋6楼
职位要求
学历要求:
研究生·统招
工作年限:
0-3年
技能/证书:
-
薪资福利
年薪范围:
18-30万*14薪
薪资福利:
-
团队架构
所属部门:
-
下属人数:
-
部门架构:
-
汇报对象:
-
职级职称:
-
面试信息
面试轮次:
2轮
面试流程:
线上面试
视频面试:
不可以接受