讨论一个ocr的idea

头像
131****0213
123阅读8评论

因为我本身是在大型能源企业做AI类应用开发的,主要是后端,前几个月去出差在开发中遇到了一个企业需求就是将合同、可研、招投标书类的扫描件(包含表格)中的内容提取出来做二次分析,比如未按规定时间签合同、招投标表格批量合并之类的,市面上的app好多试过了提取表格、手写这种效果不好,于是就开通了某app会员才得以解决,我在客户这边经常遇到类似需求,我在想是不是可以自己做一个类似的saas软件放在互联网上让大家免费使用,然后后期高级功能收费,当然不只是ocr识别,可以识别后利用大模型做一些知识提取满足下一步的客户分析需求,做一个闭环,不知道有没前途,欢迎讨论🤔

城市:
生活:
收藏
举报
精选评论
头像
等级1

你的OCR是自己部署模型,还是使用三方云资源,按照我个人理解OCR对你干说的不是通用的云资源识别,成本还是挺高的,这种都是需要消耗云资源的

是自己训练的模型,不用现成的三方接口

自己训练模型商用对硬件成本要求高

头像
等级3

我这有现成的,可以聊聊

在这里讨论一下呗,让大家都可以看看,我知道做ocr挺简单的但是对于复杂表格或者复杂格式文本识别就是乱码之类的,你的是怎么实现的

我做的是档案行业还有公司合同归档,自动著录归档,还有质检,ocr 是自己写的,没用第三方服务,训练了好多次才训练精准

头像
等级0

你可以先搞个agent试试效果,OK的话再自己部署一个开源的AI工作流

头像
等级4

挺有前途的,因该是个不错的成果。