腾讯 - 预训练-数据策略

公司简介

提供充足算力+丰富场景+顶尖团队

诚邀更多聪明大脑参与核心模型演化

在实践中探索技术的边界

投递方式

实习

方式：线上投递

招聘要求

招聘对象

2026年9月以后毕业的本硕博同学应届&低年级在校学生

岗位信息

共 1 类

开发类

岗位名称

预训练-数据策略预训练-模型结构强化学习-RL Infra & Algo Co-design强化学习-RL Compute ScalingReasoning/Agentic RLLLM/RL/Agent Frontier ResearchComplex RL Tasks后训练-指令长文后训练-Agent后训练-Reward System后训练-deep-research后训练-User Feedback RM后训练-行业应用推理后训练-Coding模型评测-LLM 评测新范式模型评测-合成数据算法研究模型评测-预训练评估分析模型评测-LLM缺陷诊断模型应用-翻译/角色扮演/code Agent/复杂创作任务相关应用模型数据策略-Coding / Agent / 长文 / 复杂任务 /模型数据策略-对话模型应用/领域专家（物理/化学/生物）前沿探索-Memory/Multi-Agent/Online Learning等前沿方向

工作地点

广东

薪酬福利

提供充足算力+丰富场景+顶尖团队

诚邀更多聪明大脑参与核心模型演化

在实践中探索技术的边界

面试题目

暂无面试题