讨论想做一个App,需要用OCR识别图片,然后用自然语言技术读取识别后文字。

头像
Serena
172阅读15评论

想做一个App,需要用OCR识别图片,然后用自然语言技术读取识别后文字。
根据识别后的文字组织格式,自动更新到pad或者显示屏上。
具体说是一个创业的开端。
可以做co-founder,也可支付开发费用。我目前在香港读MBA,计划在香港做项目申请创业基金。

讨论话题:
行业&时事
收藏
举报
加载中…
精选评论
头像
等级1

用python很简单,主要是做这个的价值是啥?

一个细分场景的应用。不是一个多大的应用。在细分市场的一个细分场景。有兴趣聊一下吗?这上面可以私聊吗?

头像
等级6

OCR 认文字不复杂,但是不走大模型的话,识图比较困难。

下一步是 RAG,并不复杂,矢量数据库+Embedding & Searching 即可。

感觉你要做 trickle.so

有指向的识图。不是需要training太多的 就是明确一个领域一个应用的。有兴趣可以私聊一下吗

我其实并不会训练自己的模型,只大概知道技术方向,所以不知道能帮上多大忙

现有模型应该是可以的

头像
等级0

Ocr识别出来后其实就是文字了呀,后面用自然语言处理是想理解识别出来的文字吗,如果要准确理解的话,就得用比较大的模型,移动端的算力可能没法做到快速反应

头像
等级0

python可以写也可以基于现有的大模型做训练!从0开始是一个很大的投入,需要大量的数据 标注然后按照你的需求进行训练!可以聊聊

头像
等级2

iOS不就自带文字识别和复制么

头像
等级1

楼主想的是ocr识别出来,然后调用大模型做后续的文字解读

头像
等级0

2种解决方案:

  1. python的, 主要通过云服务器部署, 通过API提供服务.
  2. C++, 打包成DLL, 供 app应用直接调用.
    感兴趣的话可以联系我
头像
等级0

目前有网络可以直接给出图片tag