招聘&找人文档生成项目,需搭建数据预处理管线,找靠谱数据工程合作!

头像
piggydamn
161阅读3评论

如题,找靠谱数据工程师!

项目情况:
法务文档处理和生成项目,后端已成型,需新增文档预处理管线。

目标:
将离散文档作结构化处理。

需要做啥:

  1. 搭建合同文档的自动化预处理流程:清洗、切分、结构化、分类、聚类。

  2. 使用 Python 实现 条款抽取和分类、参数化。

  3. 结合 RAG(检索增强生成)框架,优化条款推荐与合同生成效果。

  4. 维护数据管道与向量数据库,保证处理高效、稳定、可扩展。

  5. 基于open contract改造。

要求:

  • 有数据工程经验和思维,能独立设计自动化流程。

  • 熟练掌握 Python(pandas、regex、FastAPI、LangChain等)。

  • 熟悉文档解析(Word、PDF)、NLP 或文本处理经验。

  • 理解 RAG 流程:embedding、索引、召回、生成。

  • 加分项:了解合同文本或法律行业场景。

合作方式:

先从项目走起,双方认可的话就长期合作
结算方式和价格你报

招聘类型:
职业:
工作方式:
城市:
需消耗电量 5
收藏
举报
精选评论
头像
等级0

符合你们需求,保证满足你们需求,希望联系

头像
等级1

ai 分分钟就能搞定,为啥还要招人?

头像
等级0

5年AI Python后端开发,大厂经历,985软件硕士,擅长langchain,langraph,rag ,vector db等技术栈,对结构化文档数据处理比较熟悉