大家好,我想开发这样一个程序,我用deepseek总结了一下自己的需求如下,是否可以有人能实现?
【需求标题】
开发企业文件智能归档系统(Python + DeepSeek API + 可视化界面)
一、项目概述
核心目标:
通过自动化程序将散乱的企业文件(PDF/图片)按预设的Excel目录归档,并标记处理状态。
用户场景:
- 用户有大量以公司为维度的文件(如营业执照、合同等)
- 需按预设目录整理文件,并在Excel中实时反馈归档进度
二、核心功能需求
1. Excel目录解析
- 输入文件:用户提供的Excel表格
- 格式要求:
- 第1行为公司名称(每列代表一个公司)
- 第1列为文件类型(每行代表一种文件,如“营业执照”)
- 示例:
| | A公司 | B公司 |
|-------- --|--------|--------|
| 营业执照 | | |
| 合同 | | |
2. 文件识别与匹配
- 输入文件:包含PDF/图片的文件夹(支持格式:
.pdf
,.jpg
,.png
) - 处理流程:
- 调用DeepSeek API识别文件内容,确定所属公司和文件类型
- 在Excel中找到对应单元格,标记为“已归档”
- 重命名文件为
[公司名称][文件类型].[后缀]
(如A公司营业执照.pdf
) - 将文件复制到对应公司的文件夹中(自动按公司名称创建)
3. 可视化界面
- 必备组件:
- Excel文件选择按钮
- 待处理文件夹选择按钮
- 进度条+实时日志显示框
- 开始/停止操作按钮
- 界面示例:
[选择Excel文件] [选择文件夹] ----------------------------------- [进度条] 当前进度:45% [日志] - 已处理:A公司营业执照.pdf - 无法识别:unknown_123.jpg ----------------------------------- [开始处理] [停止]
4. 异常处理
- 跳过规则:
- 无法匹配到Excel目录的文件保持原名称,不复制到任何文件夹
- 文件内容识别失败时记录到日志
- 冲突处理:
- 同名文件自动添加时间戳(如
A公司营业执照_20240523.pdf
)
- 同名文件自动添加时间戳(如
三、技术需求
1. 必选技术栈
- 开发语言:Python
- 界面框架:PyQt
- 关键依赖:
- DeepSeek API(内容分类)
- OpenCV/pytesseract(图片预处理)
- pdf2image(PDF转图片)
- openpyxl(Excel操作)
2. 接口要求
- 需开放以下配置入口:
- DeepSeek API密钥设置
- 文件保存路径设置
3. 交付要求
- 输出物:
- 可执行文件(.exe,适配Windows 10/11)
- 用户手册(PDF格式,含操作截图)
- 测试标准:
- 提供50个测试文件(含PDF/图片)和样本Excel,需100%准确匹配
四、附加说明
1. 优先逻辑
- 识别优先级:
- 文件内容文本识别 > 2. 文件名关键词匹配
2. 输入输出示例
- 输入文件结构:
待处理文件夹/ ├── file1.pdf └── image123.jpg
- 输出结果:
A公司文件夹/ └── A公司营业执照.pdf Excel标记: | | A公司 | |----------|------------| | 营业执照 | 已归档 ✅ |
五、预算与周期
- 期望交付周期:30天内
- 预算范围:私聊
- 验收方式:分两阶段付款(30%预付款+70%验收付款)
六、接单开发者要求
- 有Python桌面应用开发经验(需提供案例截图)
- 熟悉OCR技术集成(需说明曾用过的OCR方案)
- 接受需求细节的远程沟通确认
七、联系信息
- 可联系时间:工作日10:00-18:00
- 需求沟通方式:腾讯会议/微信(优先文字沟通)
- 特殊要求:需签署保密协议(NDA)
附:需求示意图
(建议补充手绘流程图或界面草图,提升理解效率)
讨论话题:
城市:
你好,我这边可以做,但是语言使用golang+前端技术,广州同城可面议
怎么联系
按平台的规则,应该点我主页就能看到我的联系方式了
python 我这边也可以做
你好,有开始做了吗?我可以用你要求的 pyqt 做