腾讯社交产品中，用户关系（好友、关注、群组等）非常复杂，请设计一个用户关系图谱数据库，支持高效的查询（如查找用户的所有好友、共同好友），并说明技术选型与优化策略。

Tencent软件开发-后台开发方向难度：困难

答案

1) 【一句话结论】采用“图数据库+关系型数据库”混合架构，以图数据库（如Neo4j）为核心处理复杂关系查询（如共同好友），关系型数据库（如MySQL）存储用户基础属性与关系索引，通过索引、缓存与分片优化性能。

2) 【原理/概念讲解】老师口吻，解释用户关系图谱的节点（用户、好友、群组）和边（关注、好友关系、群成员关系）。比如，用户节点存储ID、昵称等属性；好友关系是双向边（A->B表示A的好友是B）；群组是集合节点，成员是边。图数据库的优势在于支持灵活的图遍历查询（如MATCH (a:User)-[r:friend]->(b:User) RETURN b），类比“朋友的朋友”就是通过边遍历找到共同好友。关系型数据库用于存储用户名、密码等基础数据，以及关系索引（如好友列表的哈希索引）。

3) 【对比与适用场景】

方案	定义	特性	使用场景	注意点
关系型数据库	以表格形式存储数据，强事务一致性	结构化、支持ACID、适合事务型数据	用户基础属性（ID、昵称、注册时间）、关系索引（如好友列表的哈希索引）	查询复杂关系需JOIN，性能受JOIN影响
图数据库	以节点和边存储数据，支持图遍历	灵活关系查询、适合社交网络等复杂关系场景	复杂关系查询（共同好友、推荐好友）、实时关系变更	不适合结构化数据、写入性能受索引影响

4) 【示例】
示例：

插入用户和好友关系：

MySQL插入用户表：

INSERT INTO users (user_id, nickname) VALUES (1, 'Alice'), (2, 'Bob'), (3, 'Charlie');

Neo4j插入节点和边：

CREATE (a:User {id:1, nickname:'Alice'})
CREATE (b:User {id:2, nickname:'Bob'})
CREATE (c:User {id:3, nickname:'Charlie'})
CREATE (a)-[r1:friend]->(b)
CREATE (b)-[r2:friend]->(c)

查询Alice的共同好友：

Neo4j查询：

MATCH (a:User {id:1})-[:friend]->(b:User)-[:friend]->(c:User)
WHERE a <> c
RETURN c

5) 【面试口播版答案】
面试官您好，针对腾讯社交产品的用户关系复杂场景，我设计的方案是采用“图数据库+关系型数据库”的混合架构。核心思路是用图数据库（比如Neo4j）处理复杂的图遍历查询，比如查找所有好友或共同好友，因为图数据库天然支持节点和边的灵活连接；同时用关系型数据库（比如MySQL）存储用户的基础属性（ID、昵称等）和关系索引（比如好友列表的哈希索引），保证基础数据的读写性能。具体来说，用户节点存储在图数据库中，包含ID、昵称等属性；好友关系作为双向边，比如Alice和Bob是好友，就创建A->B的friend边。查询时，比如找Alice的所有好友，直接用图遍历查询；找共同好友，通过图遍历找到两个用户之间的共同邻居节点。技术选型上，图数据库选Neo4j是因为它支持高并发图遍历，适合社交产品的实时查询需求；关系型数据库选MySQL是因为它成熟，适合存储结构化数据，并且可以通过索引（比如好友列表的哈希索引）优化查询。优化策略包括：对图数据库的查询进行缓存（比如常用查询结果缓存到Redis），减少重复查询；对关系型数据库的关系索引（比如好友列表的哈希索引）进行优化，提高查询速度；对图数据库进行分片（比如按用户ID范围分片），提高写入和查询的并发能力。这样既能高效处理复杂的用户关系查询，又能保证基础数据的性能。

6) 【追问清单】

问题：如果关系数据量很大（比如千万级用户），如何保证图数据库的查询性能？
回答要点：通过分片（按用户ID范围分片）、缓存（常用查询结果缓存到Redis）、优化查询（避免全量遍历，比如先查好友列表再局部遍历）。
问题：如果需要实时更新用户关系（比如好友添加），如何保证数据一致性？
回答要点：使用事务（图数据库和关系型数据库的事务支持），或者消息队列（比如Kafka）异步更新，确保数据一致性。
问题：如果需要支持跨平台查询（比如Web和移动端），如何优化？
回答要点：使用缓存（比如Redis缓存常用数据），或者API层统一封装查询接口，减少客户端直接查询图数据库的压力。
问题：如果遇到图遍历的深度过大（比如查找N级好友），如何优化？
回答要点：限制遍历深度（比如只查1-3级好友）、使用索引（比如对好友列表建立索引）、或者分步查询（先查一级好友，再查二级好友）。
问题：如果需要支持数据备份和恢复，如何设计？
回答要点：图数据库的备份（比如Neo4j的备份工具）、关系型数据库的备份（比如MySQL的备份工具），或者使用分布式存储（比如HDFS）进行备份。

7) 【常见坑/雷区】

只选图数据库而忽略基础数据存储：错误，图数据库不适合存储结构化数据，会导致数据冗余和性能问题。
没考虑关系索引的优化：错误，关系型数据库的关系查询（如好友列表）需索引，否则性能会下降。
忽略并发和扩展性：错误，社交产品用户量很大，需分片和缓存提高并发能力。
没考虑实时性：错误，好友添加后需实时查询共同好友，需保证实时更新。
没考虑数据一致性：错误，图数据库与关系型数据库间数据一致性需保证，否则查询结果错误。