岗位职责
1、开展强化学习算法研究,聚焦Q-learning、Deep Q Learning、PPO等经典算法,探索LLM领域中的DPO、GRPO等新型技术。
2、主导或参与游戏AI或**RPA(机器人流程自动化)**项目,设计智能体策略优化方案,推动技术落地应用。
3、攻克机器人控制、自动化系统中的复杂决策问题,提升系统智能化水平。
4、发表高水平学术论文(如NeurIPS、ICML、ICLR等顶会/期刊),参与国际学术交流。
5、协助指导团队研究,推动跨领域协作,解决工业场景中的挑战性问题。
任职要求
1、学历背景:已获得或即将获得计算机科学、人工智能、机器学习等相关领域博士学位。
2、核心能力:精通强化学习算法(Q-learning、DQN、PPO等)及LLM相关优化技术(DPO、GRPO);具备游戏AI(如OpenAI Gym、Unity ML-Agents项目)或RPA强化学习实战经验;熟练使用Python、PyTorch/TensorFlow框架,具备算法复现与工程化能力;以第一作者发表过CCF-A/B类论文或顶会论文者优先。
3、综合素质:具备独立科研能力与创新思维,对技术落地有强烈兴趣;良好的团队协作与跨学科沟通能力,能适应快节奏研发环境。
加分项
1、参与过开源强化学习项目(如Stable Baselines3、RLlib)或知名竞赛(Kaggle、AI Gaming);熟悉机器人控制(ROS、Gazebo仿真)或自动化系统开发;
2、拥有发明专利或技术转化经验。
福利待遇
1、企业薪资福利待遇:
1.1 40万年薪-60万年薪,可根据能力调整
1.2 五险一金、带薪年假、年度体检、弹性工作制,提供人才公寓;
1.3 开放包容的研发文化;
1.4 优先获得企业核心技术岗位录用机会;
1.5 协助申请深圳市高层次人才计划、孔雀团队等政策支持。
公司获批深圳市博士后创新实践基地,且与香港中文大学(深圳)签订了联合培养博士后协议,可攻读全职博士后,合作导师:由企业资深专家与香港中文大学(深圳)教授联合指导。
2、博士后在站生活补助
2.1 广东省海外博士后人才支持项目:符合条件者,每人最高可获 60 万元资助。
2.2 流动站博士后:每人最高资助 42 万元。
2.3 其他博士后:每人最高资助 36 万元。
2.4 补助分三期平均发放。
3、出站留(来)深生活补助:博士后期满出站后 6 个月内留(来)深全职工作,并与企事业单位签订 3 年以上劳动(聘用)合同的,每人可获 36 万元补助。
补助分三期平均发放或按 3:3:4 比例发放。
4、优秀博士后留深资助
在站期间获得博士后创新人才支持计划或中国博士后科学基金特别资助的博士后,出站后 6 个月内与本市签订 3 年以上劳动(聘用)合同,按国家资助标准给予 1:1 经费资助,最高不超过 30 万元。
5、创新创业留深奖励
本市博士后人员若在全国或广东省博士后创新创业大赛获奖,且出站后 6 个月内与本市签订 3 年以上劳动(聘用)合同,按国家和省奖励金额给予 1:1 创新创业奖励,最高不超过 20 万元(金奖及以上参照金奖标准)。