岗位职责:
1、针对不同端侧设备的硬件特性(CPU、GPU、NPU等)进行模型适配;
2、对大模型进行推理加速优化,优化软件对硬件的利用效率,降低软件的内存占用;
3、与端侧芯片原厂合作,针对特定硬件架构和推理引擎进行模型优化,以实现最佳性能;
岗位要求:
1、计算机、自动化、计算数学、统计学等相关专业,硕士或以上学历,具备较好的计算机通用算法基础;
2、熟悉并行计算框架,如CUDA,OpenCL等;
3、熟悉C/C++/linux等工具,及TensorFlow、PyTorch等深度学习框架;
4、有深度学习模型推理实现经验优先;
5、在高性能计算方向发表过高水平论文、获得过相关赛事奖项者优先;
6、强烈的责任心和自我驱动能力及良好的沟通能力。