关于我们:
我们是一家源自美国硅谷的科技公司,致力于在全自主eVTOL/飞行汽车领域推动创新的边界。我们的团队由充满活力、富有技术热情并且拥有共同愿景的个人组成,共同创建突破性的解决方案。利用先进的人工智能和自动导航技术,我们立志将城市空中出行的概念变为现实,迎来一个全人类家家户户便捷高效飞行的新时代。加入我们,为该领域的突破性进展做出贡献。如果您对推动创新的边界充满热情,我们诚邀您成为我们充满活力的团队的一员!
职位概述:
作为一名 AI视觉大语言模型算法实习生,您将参与研发下一代端到端自动驾驶飞行软件的核心技术,推动视觉语言模型(VLM)和视觉语言算法(VLA)在无人机与eVTOL上的应用。您的工作将聚焦于最前沿的深度学习算法,包括多模态融合、语义理解、情景推理以及生成式AI模型的开发与优化。通过您的努力,我们的飞行器将实现更高的智能化、自主性与适应性。
岗位职责:
- 视觉语言大模型开发:研究并实现最新的VLM和VLA模型技术,推动其在多模态任务中的应用,如语义分割、情景理解和航迹推理。
- 端到端模型研发:参与训练大规模的自动驾驶飞行模型,集成从感知到决策的完整自动化流程。
- 模型微调与优化:实施从微调到推理的完整模型开发流程,包括训练优化、量化、剪枝、蒸馏、压缩和部署。
- 生成式AI技术探索:研究生成式视觉模型(如SAM2、LLaVA)在视觉导航中的应用,提高模型对复杂环境的适应性。
- 多模态融合算法:将视觉、语言、图像和其他传感器数据整合到统一的模型中,实现高效、鲁棒的环境感知与推理。
- 模型优化与部署:负责在边缘设备(如NVIDIA Jetson AGX Orin)上优化模型的推理速度与资源使用效率,确保性能达标。
- 研究与创新:分析国际前沿学术论文,探索最新算法并将其转化为实际产品技术。
资格要求:
- 计算机科学、人工智能、机器人或相关领域的硕士及以上学历。
- 精通C++和Python,具备在C++平台上使用深度学习模型的经验,熟悉机器学习框架(PyTorch、LibTorch、TensorFlow、Caffe等),熟悉深度学习模型(CNN、RNN、Transformer、VLM等)并有相关项目经验。
- 具备从模型训练到部署优化的完整经验,包括蒸馏、量化、剪枝、压缩等技术,至少2年以上相关工作经验。
- 在生成式AI模型(如ChatGPT、Qwen、LLaVA、SAM2)中有应用开发经验。
- 熟悉图像语言嵌入、多模态Transformer架构及模型预训练技术。
- 有优化大规模模型推理速度和内存使用的经验。
- 英文流利,可熟练阅读理解国内外前沿学术论文。
- 自我驱动力强,对学习和探索SOTA技术抱有极高热情。
优先技能:
- 有参与端到端自动驾驶、自主飞行、机器人或自动驾驶汽车系统的开发经验。
- 有大模型优化实践经验,特别是资源受限环境下的推理加速经验。
- 有实际飞行器视觉导航或多传感器融合算法开发经验者优先。
福利:
- 具有竞争力的薪资和利润分成计划。
- 灵活的工作时间和100%远程工作选项。
- 职业成长和学习创新技术的广阔机会。
- 协作和包容的公司文化。
- 使用前沿技术和真实应用的实践经验。
工作地点:
工作地点不限,可100%远程工作。
工作时间:
没有固定的每日工作时长要求,但需确保工作质量和及时性。
薪资:
200/天-250元/天,每周提供3-4天远程实习时间。
招聘类型:
职业:
工作方式:
城市:
领域:
感兴趣,国内大厂算法工程师经验,怎么联系
有9年NLP&LLM相关工作经验,想找一份远程办公的全职工作,有意私聊
多模态算法实习生,怎么申请嘞
AI工程师