资金业务涉及海量交易数据（如每日千万级交易），请设计资金业务数据库架构，说明分库分表策略、索引优化、数据一致性保障措施，并讨论如何处理高并发下的查询性能问题。

中国长城资产管理股份有限公司资金岗难度：中等

答案

1) 【一句话结论】资金业务数据库架构需采用按时间/业务线分库分表（如按交易日期分表，按业务线分库），结合复合B+树索引（覆盖常用查询条件）、两阶段提交（2PC）保障强一致性及Redis缓存+读写分离优化高并发读写，通过水平扩展与动态分片调整支撑千万级交易。

2) 【原理/概念讲解】分库分表是水平扩展数据库的核心手段，通过将大表拆分为多个小表（分库）或行（分表），分散单库压力。比如按交易日期分表，每日数据独立存储，避免单表膨胀。索引优化中，B+树索引适合范围查询，复合索引可覆盖查询条件，减少回表次数。数据一致性方面，分布式事务（如2PC）保证强一致性，Saga模式处理跨库操作，通过补偿机制确保最终一致性。高并发下，缓存缓存热点数据，读写分离降低主库压力，分片路由快速定位数据。类比：分库分表像把大仓库分成多个小仓库，每个小仓库负责一部分货物，避免一个仓库爆满；索引优化像给货物贴标签，按标签快速找到货物，减少翻找时间。

3) 【对比与适用场景】

分库分表策略：
| 策略 | 定义 | 特性 | 使用场景 | 注意点 |
|---|---|---|---|---|
| 垂直分库 | 按业务模块拆分表（如交易表、账户表分库） | 每库表少，事务内操作少 | 业务模块独立，数据量小 | 避免跨库事务 |
| 水平分片（按时间/业务线） | 按列或行切分表（如按日期分表，或按客户ID哈希分表） | 单表数据量可控 | 数据量大，按时间或ID增长 | 分片键选择影响性能 |
索引类型：
| 索引类型 | 原理 | 适用场景 | 优缺点 |
|---|---|---|---|
| B+树索引 | 联接有序，叶子节点存储数据 | 范围查询、排序 | 适合高并发，更新开销大 |
| 哈希索引 | 哈希函数映射键到桶 | 等值查询 | 适合精确匹配，不支持范围 |
分布式事务：
| 模式 | 原理 | 适用场景 | 风险 |
|---|---|---|---|
| 两阶段提交（2PC） | 协调者发起准备、提交，参与者响应 | 需强一致性，事务内操作少 | 可能阻塞，失败时回滚 |
| Saga模式 | 链式操作，失败时补偿 | 跨库操作多，需最终一致性 | 补偿逻辑复杂，可能丢失数据 |

4) 【示例】
假设交易表（trade）按日期分表，表名trade_202401，分片键为trade_date。分库分表后，查询某日交易用分片路由，索引优化用复合索引（trade_date, trade_id）。

分片路由函数：

function getShardKey(date) {
    return "trade_" + date;
}

查询某日交易：

SELECT * FROM trade WHERE trade_date = '20240101' ORDER BY trade_id LIMIT 100;

索引创建：

CREATE INDEX idx_trade_date_id ON trade(trade_date, trade_id);

分布式事务（2PC）流程：
1. 客户端调用协调者（如ZooKeeper或消息队列）发起事务。
2. 协调者向所有参与者（如交易库、账户库）发送“准备”请求。
3. 参与者执行本地事务，返回“准备成功”或“失败”。
4. 协调者收到所有参与者响应后，发送“提交”或“回滚”指令。
5. 参与者执行最终操作。

5) 【面试口播版答案】资金业务数据库架构设计上，核心是分布式分库分表结合读写分离，针对千万级交易，分库分表按时间维度（如按交易日期分表）或业务线（如结算、理财分库）切分，避免单库压力。索引优化采用复合B+树索引（如按交易日期+交易ID排序），覆盖常用查询条件，减少全表扫描。数据一致性通过两阶段提交（2PC）保障强一致性，处理跨库操作；高并发查询时，结合Redis缓存热点数据（如交易流水、账户余额），读写分离（从库查询，主库写），分片路由确保查询高效。总结来说，通过分库分表水平扩展、索引覆盖优化查询、事务机制保障一致性，有效支撑高并发交易处理。

6) 【追问清单】

分库分表时如何选择分片键？
回答要点：分片键需均匀分布数据，避免热点，比如按交易日期分表（时间维度），或按客户ID哈希分表（业务维度），确保每个分片数据量均衡。
数据一致性如何处理跨库事务？
回答要点：采用两阶段提交（2PC）保证强一致性，Saga模式处理跨库操作，结合补偿机制确保最终一致性，适用于复杂跨库场景。
高并发下如何优化查询性能？
回答要点：缓存Redis预热热点数据（如每日交易前加载），读写分离降低主库压力，索引覆盖减少I/O，分片路由快速定位数据。

7) 【常见坑/雷区】

分片键选择不当导致热点，比如按ID连续增长分表，导致新数据集中在一个分片，性能下降。
索引顺序错误，如按非查询条件排序，导致复合索引失效，查询仍需回表。
分布式事务选择错误，如资金业务需强一致性，却用Saga模式，导致资金错误。
缓存未设置过期策略，或未考虑缓存击穿，导致热点数据失效后查询压力激增。
分库分表后查询逻辑未优化，如未使用分片路由，导致跨分片查询性能差。