想做一个App,需要用OCR识别图片,然后用自然语言技术读取识别后文字。
根据识别后的文字组织格式,自动更新到pad或者显示屏上。
具体说是一个创业的开端。
可以做co-founder,也可支付开发费用。我目前在香港读MBA,计划在香港做项目申请创业基金。
讨论话题:
行业&时事
想做一个App,需要用OCR识别图片,然后用自然语言技术读取识别后文字。
根据识别后的文字组织格式,自动更新到pad或者显示屏上。
具体说是一个创业的开端。
可以做co-founder,也可支付开发费用。我目前在香港读MBA,计划在香港做项目申请创业基金。
用python很简单,主要是做这个的价值是啥?
一个细分场景的应用。不是一个多大的应用。在细分市场的一个细分场景。有兴趣聊一下吗?这上面可以私聊吗?
python
硬件端怎么搞 知道么~
OCR 认文字不复杂,但是不走大模型的话,识图比较困难。
下一步是 RAG,并不复杂,矢量数据库+Embedding & Searching 即可。
感觉你要做 trickle.so?
有指向的识图。不是需要training太多的 就是明确一个领域一个应用的。有兴趣可以私聊一下吗
我其实并不会训练自己的模型,只大概知道技术方向,所以不知道能帮上多大忙
现有模型应该是可以的
Ocr识别出来后其实就是文字了呀,后面用自然语言处理是想理解识别出来的文字吗,如果要准确理解的话,就得用比较大的模型,移动端的算力可能没法做到快速反应
用云服务不行么~
python可以写也可以基于现有的大模型做训练!从0开始是一个很大的投入,需要大量的数据 标注然后按照你的需求进行训练!可以聊聊
iOS不就自带文字识别和复制么
楼主想的是ocr识别出来,然后调用大模型做后续的文字解读
2种解决方案:
感兴趣的话可以联系我
目前有网络可以直接给出图片tag