logo
【该文在 2021-09-16T18:53:43.468+08:00 时间 被 林民币 用户隐藏】

招聘【招募技术合伙人:公司股权+现金10万RMB+专利共同发明人】用户上传图片与美USPTO外观专利图做以图识图

头像
林民币
263阅读6评论7 个月前
 1. 需求简介
  将用户上传的图片与美国外观专利(USPTO)数据图片进行比对,按照相似度从高到低排列这些图片,就是图片的近似性检索。
 2. 实现过程
  目前团队思路清晰,需要技术合伙人实现
  (1)从美国商标专利局下载外观专利数据,约80万条,每条专利有6张不同角度的框线图,这个数据库是每天更新且公开的,目前已经把数据下载整理好
  https://developer.uspto.gov/product/patent-grant-single-page-tiff-images#product-files
  (2)解析下载的tif文件,提取其中的图片信息,建成外观专利数据库。PDF文件转图片的技术难点是每页PDF文档中有多张图片,解决办法有两个:一是用神经网络+人工标注的办法识别每张图片下方的FIG字样,这部分团队其他成员会协助解决,并承担相关费用;二是用页面信息密度做图片分割;并进行各个角度的旋转变换,这是为了提高图片匹配的精度,因为用户上传的图片角度可能千差万别;

  (3)将用户上传的图片转为黑白的且只有外框轮廓的矢量图,因为USPTO的外观专利数据图片也是黑白的;

  (4)将转化后的矢量图与建好的外观专利数据库进行以图识图对比,可以调用公共库,并在此基础上修改;第(2)、(3)两步的整理阶段会花费较多时间,也是为了提高后面的识别精度,减少工作量;

  (5)列出相似度高于某个值的外观专利
 3. 数据处理量:最多80万条×6张=480万张图片
 4. 数据处理难点:美国商标专利局数据库里的数据为框线图,有6个不同角度,用户上传的图片为实拍图,且只有一个角度,即1对1地用实拍图查找框线图
 5. 数据处理时间:半年-1年时间完成,开发完成后要长期维护
 6. 数据处理报酬:现金10万RMB作为一次性开发的报酬,也可以加入公司成为长期技术合伙人,以图识图将申请发明专利,技术合伙人将作为专利的共同发明人,并分享部分公司股权;目前公司有4位合伙人,正在申请全国高新技术企业,有意了解公司情况和商业模式请微信或邮箱联系;
 7. 说明:这个项目不是短期单纯外包,希望申请人认可公司商业前景,加入团队,共同成长;要有相关项目经验,减少重新学习时间。如果有意合作,我会给100条测试数据,检验识别效果。
  

8.测试数据:链接:链接:https://pan.baidu.com/s/1nuR7_JCY80_zP7aNIKmvKA ,提取码:wgzt
有意微信联系。

招聘类型:
组队合伙
专业领域:
开发
工作方式:
线上兼职同城驻场全职坐班远程工作
城市:
广州其他郑州苏州成都西安武汉深圳南京北京上海杭州厦门长沙
需消耗电量 5
加载中…
精选评论
头像
7 个月前JUN

是否可以提供个数据集的网盘地址?下载太慢了。。

头像
7 个月前希卡

我来,爬虫+深度学习

头像
5 个月前Callmfa

还没找到合作伙伴,急求

头像
6 个月前Callmfa

顶一下

头像
7 个月前居平康

做图片识别的技术比较少,即使有也都在大厂里面