请分享一个你参与的大模型应用项目经验，包括技术选型、遇到的挑战及解决方案，以及项目成果。

荔枝集团大模型应用研发工程师（广州）难度：中等

答案

1) 【一句话结论】
我参与过荔枝集团智能客服大模型项目，通过RAG技术结合轻量级模型微调，解决了知识库更新滞后问题，将问题解决率提升30%，用户满意度提升15%。

2) 【原理/概念讲解】
要讲清楚大模型应用中的核心技术：RAG（检索增强生成）和模型微调。

RAG：是将外部知识库（如实时文档、数据库）与LLM结合，解决模型知识过时问题。类比：给AI专家配备“实时资料库”，让专家能查最新信息。
模型微调：通过调整模型参数，让模型更擅长特定任务（如客服话术）。类比：给专家“定制课程”，强化特定领域的专业能力。

3) 【对比与适用场景】

技术方案	定义	特性	使用场景	注意点
模型微调（Fine-tuning）	调整模型参数以适应特定任务	需标注数据，训练成本高，效果强	复杂任务（如客服对话、专业问答）	需大量标注数据，计算资源需求大
提示工程（Prompt Engineering）	优化输入提示引导模型输出	无需额外训练，成本低，灵活性高	简单任务（如信息总结、日常问答）	效果依赖提示设计，复杂任务效果有限

4) 【示例】
RAG系统伪代码示例：

def rag_query(user_question, knowledge_base):
    # 1. 检索相关文档
    relevant_docs = search_knowledge_base(user_question)  # 使用向量数据库（如FAISS）
    # 2. 提取关键信息
    context = extract_key_info(relevant_docs)
    # 3. 生成回答
    answer = llm.generate_response(user_question, context)
    return answer

# 示例调用
query = "荔枝如何保存更久？"
result = rag_query(query, knowledge_base)
print(result)

5) 【面试口播版答案】
我参与过荔枝集团内部一个智能客服大模型项目。项目目标是提升客服响应速度和问题解决率，我们选用了RAG技术结合轻量级模型微调。技术选型上，因为客服知识库更新快（比如新品信息、促销政策），所以用RAG接入实时知识库，同时针对客服话术对模型进行微调，优化对话流畅度和准确性。遇到的挑战是知识库检索效率问题——实时数据量很大，导致响应延迟。解决方案是优化检索算法，比如用FAISS构建向量索引，结合HNSW算法加速近似最近邻搜索，同时限制检索文档数量（如取前3条），平衡准确性和速度。项目成果方面，上线后客服问题解决率从65%提升到85%，用户满意度从78%提升到92%，处理效率提升了40%。

6) 【追问清单】

问：为什么选择RAG而不是直接用微调？
答：因为客服知识库需要实时更新，微调模型无法快速适应新知识，而RAG可以动态接入知识库。
问：挑战中提到的检索效率优化具体做了什么？
答：使用了FAISS构建向量索引，结合HNSW算法加速检索，同时限制检索文档数量，平衡准确性和速度。
问：模型微调的标注数据来源？
答：从历史客服对话和知识库文档中提取标注数据（如“用户问X，正确回答是Y”）。
问：项目中的团队协作？
答：与产品、数据标注、后端开发团队协作，共同迭代模型和系统。
问：后续优化的方向？
答：考虑引入多轮对话管理，提升复杂问题处理能力，以及结合用户画像进行个性化回答。

7) 【常见坑/雷区】

技术选型描述不具体，比如只说“用了大模型”，没说明为什么选RAG或微调。
挑战描述太笼统，比如“遇到问题”，没具体说明是什么问题（如知识库更新慢、响应延迟）。
成果不量化，比如只说“提升了效率”，没给出具体数据（如40%提升）。
忽略技术细节，比如没提检索算法、模型参数调整等，显得不专业。
没有说明团队协作或个人贡献，比如只说“我做了什么”，没体现合作。