讨论想做一个App，需要用OCR识别图片，然后用自然语言技术读取识别后文字。

Serena180阅读15评论超过 2 年前

想做一个App，需要用OCR识别图片，然后用自然语言技术读取识别后文字。
根据识别后的文字组织格式，自动更新到pad或者显示屏上。
具体说是一个创业的开端。
可以做co-founder，也可支付开发费用。我目前在香港读MBA，计划在香港做项目申请创业基金。

讨论话题:

行业&时事

顶

踩

Serena

qsymin

创建于2023年11月21日

加载中…

精选评论

超过 2 年前 Sisyphus

用python很简单，主要是做这个的价值是啥？

一个细分场景的应用。不是一个多大的应用。在细分市场的一个细分场景。有兴趣聊一下吗？这上面可以私聊吗？

python

硬件端怎么搞知道么~

OCR 认文字不复杂，但是不走大模型的话，识图比较困难。

下一步是 RAG，并不复杂，矢量数据库+Embedding & Searching 即可。

感觉你要做 trickle.so？

有指向的识图。不是需要training太多的就是明确一个领域一个应用的。有兴趣可以私聊一下吗

我其实并不会训练自己的模型，只大概知道技术方向，所以不知道能帮上多大忙

现有模型应该是可以的

Ocr识别出来后其实就是文字了呀，后面用自然语言处理是想理解识别出来的文字吗，如果要准确理解的话，就得用比较大的模型，移动端的算力可能没法做到快速反应

用云服务不行么~

python可以写也可以基于现有的大模型做训练！从0开始是一个很大的投入，需要大量的数据标注然后按照你的需求进行训练！可以聊聊

iOS不就自带文字识别和复制么

楼主想的是ocr识别出来，然后调用大模型做后续的文字解读

电一下举报

超过 2 年前吃吃吃

2种解决方案:

python的, 主要通过云服务器部署, 通过API提供服务.
C++, 打包成DLL, 供 app应用直接调用.
感兴趣的话可以联系我

电一下举报

超过 2 年前 183****8710

目前有网络可以直接给出图片tag

电一下举报

版块详情

讨论

8k 帖子

30k 评论

194 关注

版主

空缺中，申请版主请于站长联系

远程全职推荐

刷新

查看全部

推荐帖子

【税】海外雇主怎么交税呢？

软件工程师挂靠

react 中无法使用mysql？

最好找的是什么工作？

为何不给宝妈们一个机会

下载App

公众号

下载APP以便及时收到回复或进展

讨论想做一个App，需要用OCR识别图片，然后用自然语言技术读取识别后文字。

Serena

讨论

【税】海外雇主怎么交税呢？

软件工程师挂靠

react 中无法使用mysql？

最好找的是什么工作？

为何不给 宝妈们一个机会

为何不给宝妈们一个机会