现有结合llama模型和ppo的任务规划系统,在一个仿真环境virtualhome里进行任务规划,llama给出指令,ppo负责调整模型参数来提高任务执行的正确率(这部分代码已经写好了),想实现不用llama模型,单纯用强化学习算法来实现任务规划
预算:2k
非诚勿扰
大模型这么便宜啊,还是不学了
所以我说的是想不用大模型了
找俺试试,俺是大厂算法工程师
hello,方便加V聊聊吗?有算法需求
加你了
v搜不到,发了条短信
俺可以试试,怎么联系一下?简单介绍一下自己,做过一些强化学习的规划任务,在机器人顶会上发过一些文章。
方便给个v或者电话吗?
有大模型相关的开发经验,可以试着做一下
下载APP,能及时收到回复或进展
大模型这么便宜啊,还是不学了
所以我说的是想不用大模型了
找俺试试,俺是大厂算法工程师
hello,方便加V聊聊吗?有算法需求
加你了
v搜不到,发了条短信
俺可以试试,怎么联系一下?简单介绍一下自己,做过一些强化学习的规划任务,在机器人顶会上发过一些文章。
方便给个v或者电话吗?
有大模型相关的开发经验,可以试着做一下