职位:无人车决策算法工程师——强化学习方向-美团
【岗位职责】
主要负责强化学习算法在无人车决策问题中的应用研究,并完成算法开发,具体如下: 1.参与无人车仿真环境的构建和维护; 2.负责适用于无人车决策的强化学习算法研发,提升训练效率和策略收益; 3.跟踪深度强化学习的发展趋势,掌握基本的强化学习算法,如DDPG、PPO等。
【岗位要求】
【满足以下1~2项要求】 1.在机器学习方向有扎实的知识储备,熟悉主流的强化学习算法; 2.熟悉应用深度学习平台tensorflow/pytorch,快速开发分布式强化学习算法; 3.掌握一种常用的编程语言,如C++、python等; 4.学习求知欲强,能够主动快速学习。 【加分项】 1.熟悉SMARTS强化学习训练平台,熟悉基于Ray平台的强化学习算法开发; 2.熟悉应用于无人车决策的强化学习算法或案例; 3.在人工智能和机器人领域顶级期刊或会议发表过论文。
【实习待遇和要求】
工作城市:北京 | 职位类别:算法
薪资:250-300元/天 | 实习要求:5天/周,3个月以上 | 转正机会:有
投递地址:https://www.nowcoder.com/job/2005?jobIds=58331
我发布的其他职位,点击查看
全部评论
(1) 回帖