讨论自动整理档案程序(基于Excel目录的文件自动归档,依赖DeepSeek API进行内容识别)

头像
吃猫的鱼
132阅读5评论

大家好,我想开发这样一个程序,我用deepseek总结了一下自己的需求如下,是否可以有人能实现?

【需求标题】

开发企业文件智能归档系统(Python + DeepSeek API + 可视化界面)


一、项目概述

核心目标
通过自动化程序将散乱的企业文件(PDF/图片)按预设的Excel目录归档,并标记处理状态。

用户场景

  • 用户有大量以公司为维度的文件(如营业执照、合同等)
  • 需按预设目录整理文件,并在Excel中实时反馈归档进度

二、核心功能需求

1. Excel目录解析

  • 输入文件:用户提供的Excel表格
  • 格式要求:
    • 第1行为公司名称(每列代表一个公司)
    • 第1列为文件类型(每行代表一种文件,如“营业执照”)
    • 示例:
      | | A公司 | B公司 |
      |-------- --|--------|--------|
      | 营业执照 | | |
      | 合同 | | |

2. 文件识别与匹配

  • 输入文件:包含PDF/图片的文件夹(支持格式:.pdf, .jpg, .png
  • 处理流程:
    1. 调用DeepSeek API识别文件内容,确定所属公司文件类型
    2. 在Excel中找到对应单元格,标记为“已归档”
    3. 重命名文件为[公司名称][文件类型].[后缀](如A公司营业执照.pdf
    4. 将文件复制到对应公司的文件夹中(自动按公司名称创建)

3. 可视化界面

  • 必备组件:
    • Excel文件选择按钮
    • 待处理文件夹选择按钮
    • 进度条+实时日志显示框
    • 开始/停止操作按钮
  • 界面示例:
    [选择Excel文件] [选择文件夹]  
    -----------------------------------  
    [进度条] 当前进度:45%  
    [日志]  
    - 已处理:A公司营业执照.pdf  
    - 无法识别:unknown_123.jpg  
    -----------------------------------  
    [开始处理] [停止]  
    

4. 异常处理

  • 跳过规则:
    • 无法匹配到Excel目录的文件保持原名称,不复制到任何文件夹
    • 文件内容识别失败时记录到日志
  • 冲突处理:
    • 同名文件自动添加时间戳(如A公司营业执照_20240523.pdf

三、技术需求

1. 必选技术栈

  • 开发语言:Python
  • 界面框架:PyQt
  • 关键依赖:
    • DeepSeek API(内容分类)
    • OpenCV/pytesseract(图片预处理)
    • pdf2image(PDF转图片)
    • openpyxl(Excel操作)

2. 接口要求

  • 需开放以下配置入口:
    • DeepSeek API密钥设置
    • 文件保存路径设置

3. 交付要求

  • 输出物:
    • 可执行文件(.exe,适配Windows 10/11)
    • 用户手册(PDF格式,含操作截图)
  • 测试标准:
    • 提供50个测试文件(含PDF/图片)和样本Excel,需100%准确匹配

四、附加说明

1. 优先逻辑

  • 识别优先级:
    1. 文件内容文本识别 > 2. 文件名关键词匹配

2. 输入输出示例

  • 输入文件结构:
    待处理文件夹/  
      ├── file1.pdf  
      └── image123.jpg  
    
  • 输出结果:
    A公司文件夹/  
      └── A公司营业执照.pdf  
    Excel标记:  
      |          | A公司      |  
      |----------|------------|  
      | 营业执照 | 已归档 ✅ |  
    

五、预算与周期

  • 期望交付周期:30天内
  • 预算范围:私聊
  • 验收方式:分两阶段付款(30%预付款+70%验收付款)

六、接单开发者要求

  1. 有Python桌面应用开发经验(需提供案例截图)
  2. 熟悉OCR技术集成(需说明曾用过的OCR方案)
  3. 接受需求细节的远程沟通确认

七、联系信息

  • 可联系时间:工作日10:00-18:00
  • 需求沟通方式:腾讯会议/微信(优先文字沟通)
  • 特殊要求:需签署保密协议(NDA)

附:需求示意图

(建议补充手绘流程图或界面草图,提升理解效率)


讨论话题:
城市:
顶 1
收藏
举报
充电支持Ta
1 人已充电
共建者
精选评论
头像
等级0

你好,我这边可以做,但是语言使用golang+前端技术,广州同城可面议

按平台的规则,应该点我主页就能看到我的联系方式了

头像
等级1

python 我这边也可以做

头像
等级0

你好,有开始做了吗?我可以用你要求的 pyqt 做