项目概览:与高中数学老师合作,以RAG架构打造一款智能问答AI(仅数列板块)。
一、关于项目和我
我是一名拥有多年经验的资深高中数学教师,积累了大量的教案与习题详解(数列板块)。我希望利用AI技术(RAG)将这些知识激活,构建一个能理解学生问题、并基于我的教学材料进行精准答疑的智能助手。
我也是您在这个项目里唯一的甲方和产品经理,我能提供:
高质量、体系化的知识库:所有关于数列的教案、例题、解题技巧
绝对专业的领域知识:为您提供所有数学内容的权威解读与校验
清晰的需求与反馈:作为教师,我清楚什么样的教育效果最有效。
我不是技术专家,因此我需要您具备强大的自主技术决策和实现能力。
二、您需要完成的工作
1、数据处理并构建向量数据库:对我提供的教案与习题进行解析、文本清洗与提取,选择合适模型构建数列板块向量数据库。
2、RAG开发:基于LangChain框架(或Llamalndex)搭建集成DEEPSEEK等大模型API的检索与生成管道。
3、测试优化并交付一个可用demo,可以是一个命令行工具,也可以是一个简单的前端界面,核心是准确、稳定的问答能力。
三、我们希望您具备
1、精通Python,有使用有LangChain或LlamaIndex等框架构建RAG项目的实际经验(请务必在申请时提供相关项目链接或描述)。
2、数据库: 熟悉至少一种向量数据库(ChromaDB, FAISS, Milvus, Pinecone等)的应用。
3、大模型: 有调用OpenAI、DeepSeek等大模型API的经验,了解Prompt Engineering的基本技巧。
4、数据处理: 熟悉处理PDF、Word等非结构化数据的工具库(如pypdf, docx, pdfplumber等)。
5、加分项:对教育事业有热情/有教育科技类开发经验,具备良好的沟通能力,有处理数学、科学公式的经验,具备一定前端基础可搭建演示界面。
四、合作方式与报酬
周期:预计总工期2个月(希望尽快启动),需要您能投入充足的时间。
报酬:6万元人民币。如提前完成还有额外奖金1万元。具体支付方式可按项目阶段分期支付,具体可谈。
工作方式:远程协作。通过微信进行日常沟通。
多年的ai算法和工程经验,做过教育的ai应用,有需要可以联系我。
你好!感兴趣的话欢迎提交一份简历到我的邮箱
用dify你自己搓一个,多大的事😄
可能是直接RAG效果不好才需要专门找人做的吧,应该不是很容易做到很好效果的
dify里可以找到现成的例子,你自己改改
我思考了一下,这个的难点可能在于,公式和解题思路的检索吧,比如等差数列求通项公式,有些题目思路都是一样的,但是文字描述不同,对于向量库来说可能距离比较远很难匹配到.所以结果可能会不准确. 还有一点我个人的观点认为列出的解题步骤并不能直接等于解题思路,有些学生直接看根本不懂.关键核心在于老师的讲解,所以这部分的文本提取也很关键.
以上观点都是个人观点,可能有理解不到位的地方.请谅解哈
从我做RAG的经验来看,要做到很好的embedding的确需要一些工作量,前期需要做一些benchmark来做一些关键指标如recall,mrr,nCDG等等,然后有针对性的对embedding model进行微调. 同一个embedding模型很可能在不同的领域上表现有差异. 另外一个难点我觉得是长对话过程中对意图的捕获,因为用户的问题千奇百怪,而且,用户很难提出精确的问题,所以对query的处理很挺关键的。总之一个好的问答系统,还真不是随便就能做好,工作量还是挺多的。欢迎交流。
我做过这个项目,问题是使用rag的话,返回是特别慢的,当时的一个问题是人教版,沪教版,冀教版等材料录入其实是多份的,乘以高中三年的数据,以及部分真题
你好!高中版本的教材问题其实还好,按新课标一卷、新课标二卷简单分开就好。感兴趣的话可以发个邮件详聊一下吗?
明天发您邮件
已发送邮件,有多个rag项目开发经验。熟悉框架、向量数据库,有教育产品的开发经验。
你好!已收到邮件,正在拜读中,请稍候
如何联系
你好,感兴趣欢迎投简历到我的邮箱
远程可以,全栈
你好!感兴趣的话欢迎提交一份简历到我的邮箱
这个得结合gragh rag
你好,做数列板块暂时不需要的。不过后面涉及到立体几何感觉也有必要去做这个
已联系
你好!已收到邮件,正在拜读中,请稍候
做一个类似的项目😬😬😬
可联系2年llm应用开发经验。
LangChain+ChromaDB+openAI落得财务项目,也是基于word文档处理,可以联系。
建议一下吧,我有rag全流程开发经验。