招聘&找人(远程)AI视觉大语言模型实习生/源自硅谷初创/前沿技术

头像
飞沃智航|...
139阅读4评论

关于我们:
我们是一家源自美国硅谷的科技公司,致力于在全自主eVTOL/飞行汽车领域推动创新的边界。我们的团队由充满活力、富有技术热情并且拥有共同愿景的个人组成,共同创建突破性的解决方案。利用先进的人工智能和自动导航技术,我们立志将城市空中出行的概念变为现实,迎来一个全人类家家户户便捷高效飞行的新时代。加入我们,为该领域的突破性进展做出贡献。如果您对推动创新的边界充满热情,我们诚邀您成为我们充满活力的团队的一员!

职位概述:
作为一名 AI视觉大语言模型算法实习生,您将参与研发下一代端到端自动驾驶飞行软件的核心技术,推动视觉语言模型(VLM)和视觉语言算法(VLA)在无人机与eVTOL上的应用。您的工作将聚焦于最前沿的深度学习算法,包括多模态融合、语义理解、情景推理以及生成式AI模型的开发与优化。通过您的努力,我们的飞行器将实现更高的智能化、自主性与适应性。

岗位职责:

  1. 视觉语言大模型开发:研究并实现最新的VLM和VLA模型技术,推动其在多模态任务中的应用,如语义分割、情景理解和航迹推理。
  2. 端到端模型研发:参与训练大规模的自动驾驶飞行模型,集成从感知到决策的完整自动化流程。
  3. 模型微调与优化:实施从微调到推理的完整模型开发流程,包括训练优化、量化、剪枝、蒸馏、压缩和部署。
  4. 生成式AI技术探索:研究生成式视觉模型(如SAM2、LLaVA)在视觉导航中的应用,提高模型对复杂环境的适应性。
  5. 多模态融合算法:将视觉、语言、图像和其他传感器数据整合到统一的模型中,实现高效、鲁棒的环境感知与推理。
  6. 模型优化与部署:负责在边缘设备(如NVIDIA Jetson AGX Orin)上优化模型的推理速度与资源使用效率,确保性能达标。
  7. 研究与创新:分析国际前沿学术论文,探索最新算法并将其转化为实际产品技术。

资格要求:

  1. 计算机科学、人工智能、机器人或相关领域的硕士及以上学历。
  2. 精通C++和Python,具备在C++平台上使用深度学习模型的经验,熟悉机器学习框架(PyTorch、LibTorch、TensorFlow、Caffe等),熟悉深度学习模型(CNN、RNN、Transformer、VLM等)并有相关项目经验。
  3. 具备从模型训练到部署优化的完整经验,包括蒸馏、量化、剪枝、压缩等技术,至少2年以上相关工作经验。
  4. 在生成式AI模型(如ChatGPT、Qwen、LLaVA、SAM2)中有应用开发经验。
  5. 熟悉图像语言嵌入、多模态Transformer架构及模型预训练技术。
  6. 有优化大规模模型推理速度和内存使用的经验。
  7. 英文流利,可熟练阅读理解国内外前沿学术论文。
  8. 自我驱动力强,对学习和探索SOTA技术抱有极高热情。

优先技能:

  • 有参与端到端自动驾驶、自主飞行、机器人或自动驾驶汽车系统的开发经验。
  • 有大模型优化实践经验,特别是资源受限环境下的推理加速经验。
  • 有实际飞行器视觉导航或多传感器融合算法开发经验者优先。

福利:

  • 具有竞争力的薪资和利润分成计划。
  • 灵活的工作时间和100%远程工作选项。
  • 职业成长和学习创新技术的广阔机会。
  • 协作和包容的公司文化。
  • 使用前沿技术和真实应用的实践经验。

工作地点:
工作地点不限,可100%远程工作。

工作时间:
没有固定的每日工作时长要求,但需确保工作质量和及时性。

薪资:
200/天-250元/天,每周提供3-4天远程实习时间。

招聘类型:
职业:
工作方式:
城市:
需消耗电量 5
收藏
举报
加载中…
精选评论
头像
等级0

感兴趣,国内大厂算法工程师经验,怎么联系

头像
等级0

有9年NLP&LLM相关工作经验,想找一份远程办公的全职工作,有意私聊

头像
等级0

多模态算法实习生,怎么申请嘞

版块详情

招聘&找人

19k 帖子
141k 评论
805 关注
非主流的工作机会在这里更受欢迎~
版主
远程全职推荐

扫码下载应用

下载APP,能及时收到回复或进展