【项目背景】
我们已完成基础基建:阿里云服务器(2核4G)、Dify社区版、DeepSeek-R1付费接口、影刀RPA软件。现需要一名专家将这些工具打通,实现**“京东/天猫后台数据自动抓取 -> Dify 知识库清洗 -> DeepSeek 深度分析 -> 结果自动返还”**的全链路闭环。
【核心职责】
- 影刀端数据攻坚: 负责京东商智等平台复杂页面(多层Iframe、动态ID、加密接口)的稳定抓取。确保数据能够以结构化(JSON/CSV)形式实时产出。
- Dify 工作流搭建: 在 Dify 中设计高度逻辑化的 Workflow。利用 DeepSeek-R1 的推理能力,对电商原始数据进行归因分析(如:为什么昨天转化率跌了?)。
- API 链路打通: 编写脚本实现影刀与 Dify API 的对接,确保抓取后的数据能自动触发 Dify 的工作流并完成入库或分析。
- 性能调优(针对2核4G配置): 优化 Dify 在阿里云低配服务器上的运行效率,合理配置 Docker 容器资源与向量数据库。
【技术要求】
- 精通影刀RPA: 必须有处理商智/生意参谋高强度反爬、动态元素定位的实战案例(不接受只会录制流程的新手)。
- 熟悉 Dify 环境: 能够熟练配置 Dify 的 Agent 节点、知识库(RAG)和变量传递,懂如何通过 API 触发工作流。
- 懂 DeepSeek 调优: 擅长编写针对 DeepSeek-R1 推理模型的 Prompt(提示词),减少幻觉,确保分析结果符合电商逻辑。
- Python 基础: 能在阿里云 Linux 环境下进行简单的 Docker 维护、接口联调脚本编写。
- 熟悉电商优先
招聘类型:
职业:
工作方式:
领域:


8


你这个方案跑不通,dify在2核4g上难堪大用,可以考虑纯代码agent用fastapi,deepseek在纯代码框架下能设计多轮复杂思维链
感谢你的建议
2h4g 他不用知识库,实际上就是一个可视化的 Agent +api,够用了,知识库的向量数据库才是吃配置的大头,而且向量数据越多维度越高配置要求越高。
而且你仔细看需求,我们讨论的 AI 部分的都不是难点,他的难点在数据爬取,这一块是0。
不用rag确实够了
开发难度还好吧,就是维护成本比较高
我们刚开始搭建,目前并没有一个有经验的,完整的路线图。目前是往前走到哪一步 遇到哪个卡点先解决哪个。现在的卡点问题就是我们需要影刀抓取京东店铺的运营数据。这一步实现了,我们再看看下一步会遇到什么问题,
电扇人 自己矩阵一月150w gmv ,精通某平台标准投流,全站投流,专业软件开发,打通某平台玩法,全流程自动化,某平台电商商业软件作者。精通程序开发 逆向 高级爬虫 需要扣我,一起进步
您可以解决影刀的编程吗,获取我们店铺的京准通和商智数据
影刀的部分,我这边方便具体了解下你们的需求吗。
你现在这一套流程基本上已经很完善了,打通影刀与 dify 的连接就可以了,你说的向量数据库根本没必要,你这里没有用到知识库,数据也不需要向量化,向量化后反而降低精度。
你的整个链路中没有用到知识库的场景(电商一般用到 ai客服 、ai 写产品介绍、员工培训等场景,其他的数据分析之类的是用不到的。 )
客服,产品介绍 ,员工培训我我们暂时都不需要,只需要推广数据分析
考虑用agent skills重写吗?
可以联系一下具体沟通吗
加你了
十几年的开发经验+两年ai 开发经验,请联系
AI 产品3年,8年产品,企业工作流落地经验丰富。
精通python开发、 DeepSeek-R1 / V3的 Prompt Engineering,能够熟练配置 Dify 的 Agent 节点。可以提供部分测试demo。可以联系我
可以加联系沟通吗,你的需求我很感兴趣,想把他包装成一个产品,可以沟通吗,我也可以提供一定的帮助。