岗位职责:
1、根据业务场景需求,基于大模型技术和Al agents开发,设计并实施算法适配和调优工程方案;
2、负责大模型的训练和应用落地,包括promptengineer、数据构建、模型工具调用微调(LORA、SFT、DPO、PPO)、评测、部署应用;
3、参与领域模型的全流程工作,包括但不限于数据、训练、评测、推理部署,保证数据的高质量和有效性;
4、结合实际业务场景,将大模型技术应用于具体的产品或服务中,支持公司垂类业务落地,推动产业智能化升级;
5、熟练Docker运用,熟练Flask,FastApi等API框架。
岗位要求:
1、硕士及以上学历,计算机、数学相关专业,深度学习和自然语言处理等领域的相关背景知识,1年以上工作经验;
2、熟悉主流大模型基本原理,对大模型有技术热情,熟悉Mixtral/Llama/ChatGLM等模型的原理;
3、具备大模型应用开发经验,包括RAG优化、function calling、LangChain、LlamaIndex、stable diffusion使用等方面;
4、具备模型部署等工程化落地,生产环境模型并发推理加速经验;
5、 具备强化训练基础,熟悉DRL领域相关算法和实战经验优先,如DQN,A2C等;
6、熟练掌握TensorFlow、PyTorch、vllm、tensorrt、Megatron、DeepSpeed等技术和框架,了解各种并行策略,并具备大规模分布式训练的经验。