招聘&找人找一个有大模型和强化学习算法开发经验的大佬帮忙改代码

头像
哞哞
143阅读9评论

现有结合llama模型和ppo的任务规划系统,在一个仿真环境virtualhome里进行任务规划,llama给出指令,ppo负责调整模型参数来提高任务执行的正确率(这部分代码已经写好了),想实现不用llama模型,单纯用强化学习算法来实现任务规划

预算:2k

非诚勿扰

招聘类型:
职业:
工作方式:
需消耗电量 5
收藏
举报
加载中…
精选评论
头像
等级3

大模型这么便宜啊,还是不学了

所以我说的是想不用大模型了

头像
等级1

找俺试试,俺是大厂算法工程师

头像
等级0

俺可以试试,怎么联系一下?简单介绍一下自己,做过一些强化学习的规划任务,在机器人顶会上发过一些文章。

方便给个v或者电话吗?

头像
等级0

有大模型相关的开发经验,可以试着做一下

版块详情

招聘&找人

19k 帖子
141k 评论
803 关注
非主流的工作机会在这里更受欢迎~
版主
远程全职推荐

扫码下载应用

下载APP,能及时收到回复或进展