预训练-数据策略预训练-模型结构强化学习-RL Infra & Algo Co-design强化学习-RL Compute ScalingReasoning/Agentic RLLLM/RL/Agent Frontier ResearchComplex RL Tasks后训练-指令长文后训练-Agent后训练-Reward System后训练-deep-research后训练-User Feedback RM后训练-行业应用推理后训练-Coding模型评测-LLM 评测新范式模型评测-合成数据算法研究模型评测-预训练评估分析模型评测-LLM缺陷诊断模型应用-翻译/角色扮演/code Agent/复杂创作任务相关应用模型数据策略-Coding / Agent / 长文 / 复杂任务 /模型数据策略-对话模型应用/领域专家(物理/化学/生物)前沿探索-Memory/Multi-Agent/Online Learning等前沿方向