学科要求:
模式识别与智能系统、美术学、计算机视觉、信号与信息处理等交叉学科。擅长构建模仿学习模型,精准提取人类操作特征,熟悉多模态数据(如图像、语音、视觉等)融合技术,掌握特征对齐、信息互补方法,致力于解决模型跨场景泛化问题,实现复杂环境下机器人技能迁移。
职位描述:
1、负责人形机器人的模仿学习与多模态融合研发与优化,包括但不限于图像、文本、音频等多种信息源的融合技术,推动算法的创新与应用。
2、制定并执行多模态大模型的训练与优化策略,确保算法的高效性和准确性。
3、深入探索多模态算法的前沿研究,支持团队进行算法的测试、验证和实验分析,为模型的迭代和优化提供数据支持和策略建议。
4、参与多模态大模型在实际应用场景中的部署与落地,解决具体业务问题,提升用户体验。
5、与团队成员紧密合作,共同推动项目的进展,确保项目按时、高质量地完成。
岗位职责:
1、计算机科学、人工智能、数学等相关专业,硕士及以上学历,博士优先。
2、熟练掌握C++/Python等编程语言,熟悉深度学习、机器学习的基本原理,具备扎实的数学基础。
3、精通TensorFlow、PyTorch等深度学习框架,能够编写高效、可维护的代码。
4、对多模态大模型算法有深刻理解,能够将理论知识转化为实际应用,解决复杂技术难题。
5、具有良好的英文读写能力,能够阅读和理解英文技术文档。
6、在顶级会议或期刊上发表过有影响力的学术论文或在重要算法比赛中取得过优秀名次的候选人优先考虑。
动手实践能力强,有多模态模型预训练经验者优先。
有AIGC相关经验者优先。