招聘&找人找一个有大模型和强化学习算法开发经验的大佬帮忙改代码

头像
哞哞
141阅读9评论

现有结合llama模型和ppo的任务规划系统,在一个仿真环境virtualhome里进行任务规划,llama给出指令,ppo负责调整模型参数来提高任务执行的正确率(这部分代码已经写好了),想实现不用llama模型,单纯用强化学习算法来实现任务规划

预算:2k

非诚勿扰

招聘类型:
外包零活
职业:
开发
工作方式:
线上兼职
领域:
AI/人工智能
需消耗电量 5
收藏
举报
加载中…
精选评论
头像
等级2

大模型这么便宜啊,还是不学了

所以我说的是想不用大模型了

头像
等级1

找俺试试,俺是大厂算法工程师

头像
等级0

俺可以试试,怎么联系一下?简单介绍一下自己,做过一些强化学习的规划任务,在机器人顶会上发过一些文章。

方便给个v或者电话吗?

头像
等级0

有大模型相关的开发经验,可以试着做一下