岗位职责:
1、参与自然语言处理(NLP)与大模型相关的算法研发,包括但不限于模型设计、训练优化、效果调优及工程化落地;
2、负责对开源大模型(如LLaMA、GPT、BERT、T5、BLOOM等)进行深度研究、二次开发及性能调优;
3、结合业务场景需求,设计高效的大模型训练/推理方案,解决模型规模化应用中的技术难题;
4、跟踪学术界与工业界前沿技术(如多模态、强化学习、分布式训练等),探索大模型在复杂场景中的创新应用;
5、撰写技术文档、专利及论文,推动团队技术积累与行业影响力;
6、关注行业、市场、政策等动向,深度洞察需求、变化和未来趋势,参与技术调研、研发攻关等课题相关工作。
任职要求:
1、计算机科学、数学、统计学等相关专业,硕士及以上学历(优秀本科生可放宽);
2、熟练掌握深度学习框架(PyTorch/TensorFlow/JAX等),具备扎实的算法实现与调试能力。
深入理解NLP核心任务(如文本生成、预训练、Prompt工程、模型压缩等),熟悉主流大模型架构及训练方法;
3、对开源大模型有实际调优经验,了解模型并行、数据并行、混合精度训练等技术细节;
4、具备扎实的数学功底,包括线性代数、概率统计、优化理论及微积分,能结合理论优化模型性能;
5、对AI技术有强烈热情,能主动跟进领域动态(如阅读论文、复现SOTA模型),快速学习并解决新问题;
6、具备独立研究能力,能通过实验分析定位问题并提出创新性改进方案;
7、良好的团队协作意识,能清晰表达技术方案并与跨职能团队高效配合。