项目流程要实现的是:通过一段音频,推动一个原视频,使原视频中对应的人物口型和音频口型对应,推理过程满足一定实时性要求。
目前算法研究员已经把模型训练出来了,并且在python环境可以把流程跑通,需要做的事情是,把这个流程用C++重写,并优化模型推理链路,满足一定实时性要求。
职位要求:
1)熟练使用C++和python,熟悉pytorch,opencv等工具。
2)对算法模型压缩、加速、部署有过实际经验,熟悉onnx,tensorrt等工具。
3)具备CUDA编程经验和GPU优化经验。
4)熟悉基本的音视频开发知识,有过音视频处理相关的开发经验。
5)有实际的图像、音频相关算法落地经验。
招聘类型:
职业:
城市:
领域:
谢谢你给社区的朋友们带来的工作机会:)
友情提示,请参考社区规则:https://eleduck.com/posts/6GzfGe
认真对待你的招聘帖子并补全以下内容:公司/项目介绍、交付周期、预算范围、支付方式等
换位思考,没有这些信息,申请者将很难判断自己是否应该申请;与其在之后的环节给每个人都一一解释一遍,还不如直接在帖子里写清楚,沟通效率更高。
请尽快补充完善,不符则删,谢谢理解鸭:)