前沿技术

飞沃智航｜...179阅读8评论超过 1 年前

关于我们:
我们是一家源自美国硅谷的科技公司，致力于在全自主eVTOL/飞行汽车领域推动创新的边界。我们的团队由充满活力、富有技术热情并且拥有共同愿景的个人组成，共同创建突破性的解决方案。利用先进的人工智能和自动导航技术，我们立志将城市空中出行的概念变为现实，迎来一个全人类家家户户便捷高效飞行的新时代。加入我们，为该领域的突破性进展做出贡献。如果您对推动创新的边界充满热情，我们诚邀您成为我们充满活力的团队的一员！

职位概述:
作为一名 AI视觉大语言模型算法实习生，您将参与研发下一代端到端自动驾驶飞行软件的核心技术，推动视觉语言模型（VLM）和视觉语言算法（VLA）在无人机与eVTOL上的应用。您的工作将聚焦于最前沿的深度学习算法，包括多模态融合、语义理解、情景推理以及生成式AI模型的开发与优化。通过您的努力，我们的飞行器将实现更高的智能化、自主性与适应性。

岗位职责:

视觉语言大模型开发：研究并实现最新的VLM和VLA模型技术，推动其在多模态任务中的应用，如语义分割、情景理解和航迹推理。
端到端模型研发：参与训练大规模的自动驾驶飞行模型，集成从感知到决策的完整自动化流程。
模型微调与优化：实施从微调到推理的完整模型开发流程，包括训练优化、量化、剪枝、蒸馏、压缩和部署。
生成式AI技术探索：研究生成式视觉模型（如SAM2、LLaVA）在视觉导航中的应用，提高模型对复杂环境的适应性。
多模态融合算法：将视觉、语言、图像和其他传感器数据整合到统一的模型中，实现高效、鲁棒的环境感知与推理。
模型优化与部署：负责在边缘设备（如NVIDIA Jetson AGX Orin）上优化模型的推理速度与资源使用效率，确保性能达标。
研究与创新：分析国际前沿学术论文，探索最新算法并将其转化为实际产品技术。

资格要求:

计算机科学、人工智能、机器人或相关领域的硕士及以上学历。
精通C++和Python，具备在C++平台上使用深度学习模型的经验，熟悉机器学习框架(PyTorch、LibTorch、TensorFlow、Caffe等)，熟悉深度学习模型（CNN、RNN、Transformer、VLM等）并有相关项目经验。
具备从模型训练到部署优化的完整经验，包括蒸馏、量化、剪枝、压缩等技术，至少2年以上相关工作经验。
在生成式AI模型（如ChatGPT、Qwen、LLaVA、SAM2）中有应用开发经验。
熟悉图像语言嵌入、多模态Transformer架构及模型预训练技术。
有优化大规模模型推理速度和内存使用的经验。
英文流利，可熟练阅读理解国内外前沿学术论文。
自我驱动力强，对学习和探索SOTA技术抱有极高热情。

优先技能: