社区帖子招聘寻找rag项目兼职技术开发人员

头像
139****2349
348阅读12评论

【寻找兼职rag技术工程师】多年矿产专家AI创业,针对数十年的矿产报告开发rag系统及agent,我已完成产品初步构思与地质逻辑建模,现寻找一名优秀的 AI工程实现者,共同打造地质矿产行业的“专业级 RAG 系统”。


2. 岗位职责

作为核心技术负责人,你将负责:

  • RAG 架构搭建:基于 LlamaIndex 或 LangChain 框架,构建支持大规模地质 PDF 档案的检索增强生成系统。
  • 复杂数据解析:攻克地质报告中非结构化数据的提取难点(包括复杂的专业表格、OCR 扫描件、跨页图注等)。
  • 地质逻辑对齐:与我深度配合,将“成矿系统理论”转化为 GraphRAG 或多模态检索逻辑。
  • 私有化部署:负责系统在本地环境(如 Ollama, vLLM)及国产化硬件上的工程化部署与性能优化。
  • MVP 迭代:快速实现从 0 到 1 的原型开发,支撑早期的标杆客户试用。

3. 候选人要求(我们不找“码农”,找“工程解决者”)

  • 技术底色:精通 Python,熟练掌握向量数据库(Milvus/Qdrant/Pinecone)及主流 RAG 框架。
  • 实战经验:有实际的 RAG 项目落地经验,特别是处理过“脏数据”或复杂文档解析(Layout Analysis)者优先。
  • 工程思维:不迷信 API 调包,能解决 Token 限制、幻觉控制、长文本处理等实际工程问题。
  • 加分项
    • 了解或有兴趣钻研地质/矿产/能源行业知识;
    • 有全栈开发能力,能用 Streamlit 或类似工具快速构建 UI;
    • 居住在北京,方便线下深度沟通地质逻辑。
招聘类型:
职业:
工作方式:
城市:
需消耗电量 5
收藏
举报
精选评论
头像
等级1
  • 有做过类似的,用的是 llamaindex+chroma+FastAPI,大模型用的是远程 api 调用 的免费的,前端用的是开源的后台管理系统对接的。
  • 不同的是我把RAG 主体和文档清洗分开做的,RAG 主体只能上传已经清洗好的文档,否则 即便上传成功了也会影响最终的问答效果,并加入了文档溯源,显示答案来源的文件名和页码,主体还设置了权限分离,管理员可以进行文档上传和删除,普通用户只能问答,还有 query_rewrite,rerank,智能分块等等
  • 文档清洗部分是单独用 langgraph 做的工作流,加入了 LLM 辅助判断是否需要人工审核等等,如果不需要就直接转成md 和 json 格式,这样可以形成半自动化的批量清洗。
  • 我之所以分开做,是因为我觉得文档清洗这部分很难做到适配大部分场景,只能做个我这种大概流程能满足的,然后再根据不同的需求去完善,否则会导致 RAG 主体工能太臃肿甚至越改越乱。

多谢评价,有兴趣,可以聊一下

头像
等级1

在BAT做过基于LangChain + ChatGPT + Text Embedding + Qdrant的RAG搜索,效果还不错,已加楼主联系方式,如果有机会可以聊聊。

头像
等级0

楼主您好!我认为我们团队与您的需求非常匹配:

  • 初创软件工作室,3人成熟团队,成员都是资深全栈,追求现代技术和长期维护性。
  • 有多个RAG相关项目经验,包括langchain/langgraph实战经验、集成过openwebui、也使用过Spring AI实现企业级RAG系统。技术栈覆盖python(fastapi)、kotlin(springboot)等生态,前端覆盖nextjs/react、nuxtjs/vue生态。有多个系统架构设计经验,包括选型、性能优化、分布式等。
  • 具有生产级大模型部署经验(deepseek-r1,机架式服务器,英伟达Hopper架构)。

RAG整体流程较复杂(ETL流程、传统RAG和Agentic RAG、向量库等,这部分可操作性较多),推荐楼主先实现一个最小可行产品(核心功能),效果达预期再完善外围功能,后期也可以按需进行模块拆分和优化,甚至接入其他技术栈。技术栈推荐langchain(python),对RAG和Agent的支持都非常成熟。

从设计、开发到部署我们都可以整包,分阶段收费(可对公)。我们会根据您的需求提供技术方案。
详情官网 icedeer Studio: https://icedeer.net 。免费咨询,有兴趣可联系详聊。

头像
等级0

想加入 但是我没做过 agent 方向

头像
等级0

做了16年开发的码农飘过

头像共建者
等级8

谢谢你给社区的朋友们带来的工作机会:)

友情提示,请参考社区规则:https://eleduck.com/posts/6GzfGe

认真对待你的招聘帖子并补全以下内容:公司/项目介绍、交付周期、预算范围、支付方式等

换位思考,没有这些信息,申请者将很难判断自己是否应该申请;与其在之后的环节给每个人都一一解释一遍,还不如直接在帖子里写清楚,沟通效率更高。

请尽快补充完善,不符则删,谢谢理解鸭:)

头像
等级1

你这个需要写代码才能做到细节

头像
等级1

我是一名拥有近 6 年经验的资深前端工程师,曾统筹团队前端基建(主导 GitLab CI/CD 落地)、攻坚过复杂的 BPMN 业务审批流与极耗性能的海量数据可视化面板。

在扎实的前端底盘之上,我目前已深度转型为 AI 全栈工程师,专注于解决大模型产品落地中的工程化痛点。 随信附上我近期独立打通全栈并部署上线的两个商业级 AI 项目,欢迎直接体验:

  • 🔗 AxiomSchema (全栈 AI SaaS 引擎):https://www.axiomschema.top

  • 技术亮点: 使用 Vue3 + Python FastAPI 彻底前后端解耦,成功突破了 Serverless 部署大模型推理的 10 秒超时瓶颈;并基于 Clerk JWT 实现了严密的多租户行级数据隔离。

  • 🔗 traceRAG (高阶 AI 知识库系统):https://www.tracerag.top

  • 技术亮点: 落地 TopK + MMR 高阶检索策略,并通过“精准补丁”与 Query Rewrite 优化,大幅降低了 Token 消耗并解决了大模型幻觉问题。