我C，一个库里Curry几百个表，这谁受得了？

随着业务越来越复杂，数据量越来越大，并发量越来越大，数据库的性能越来越低。好不容易找运维申请了两台机器，让DBA部署了几个实例，想把一些业务库拆分出来，却发现一个库里几百个表，拆不出来，扩不了容，尴尬！

因为数据库强关联在一起，无法通过增加数据库实例扩容，就是一个耦合的典型案例。

什么样的场景会出现这类耦合？

举个栗子。

有一个公共用户数据库DB_USER，里面table_user存放了通用的用户数据：

table_user (uid, name, passwd, …)

在数据量比较小，并发量比较小，业务还没有这么复杂的时候，为了提高资源利用率（程序员才没有考虑什么资源利用率，更多的是图方便），业务A把用户个性化的数据也放在这个库里：

table_A(uid, A业务的个性化属性)

业务A有一个需求，即要展现用户公共属性，又要展现业务A个性化属性，程序员经常这么实现的：

select * from table_user, table_A

where table_user.uid = table_A.uid

and table_user.uid = $uid

初期关联查询没有任何问题，单条记录访问，命中索引，一次查询所有数据，简单高效。

如何产生各业务数据耦合？

通过join实现业务，导致通用表table_user和业务表table_A必须存在于一个数据库实例里。

如果业务B也这么做，业务C也这么做，会导致公用业务，业务A，业务B，业务C都必须存在于一个数据库实例里。

会产生什么潜在问题呢？

假如A业务线上线了一个新功能，不小心进行了全表扫描，导致数据库CPU100%，数据库实例性能下降，由于实例共用，通用业务，业务B和业务C都会受影响。

即某个业务线的数据库性能急剧下降导致所有业务都受影响，这种耦合，历史总是惊人的相似：

- 业务B的大boss在群里首先发飙：“技术都干啥了，怎么系统挂了”

- 业务B的rd一脸无辜：“业务A上线了，所以我们挂了”

额，然而，这个理由，好像在大boss那解释不通…

- 业务B的大boss：“赶紧加几台机器，拆分开”

- 业务B的rd一脸无奈：“加机器加实例也扩容不了”

- 业务B的大boss对业务2的rd吼道“还想甩锅，拖出去祭天”

- ...

唉，加了几台机器，加了几个实例，然而并没有什么卵用，都耦合在一个实例里，完全扩不了容。

那，如何解除公共数据库与业务数据库的耦合？

第一步：公共数据访问下沉服务化。

还是上面的例子，当公共的user数据访问服务化之后，依据服务化的原则：

（1）业务层只能通过服务RPC接口访问数据；

（2）底层user库属于user服务私有；

（3）任何上游不允许跨过服务访问底层的user库；

第二步：垂直拆分，个性化数据访问上浮。

原来业务方：通过join一次性获取通用的数据和个性化的业务数据数据。

服务化垂直拆分后，变成两次访问：

（1）一次取得业务数据（业务可以直接调用自己的数据库，也可以自己做业务服务调用RPC接口）；

（2）一次取得共性数据（调用通用的RPC接口）；

两种方式相比：

（1）之前的方式其实业务代码可能会更简单一些，因为它是将这个业务逻辑放在了SQL语句中，但是导致数据库耦合在了一起；

（2）后面这种方式就是业务的代码会更复杂，会变成多次访问，将原来在SQL中进行的逻辑计算变成业务代码中的逻辑计算，但是数据库解耦了；

业务复杂，数据量大，并发老大，对扩展性要求更高的架构，一定是后者。

此时各业务有自己的库，公共有公共的库：

（1）早期：可以放在一个数据库实例里；

（2）后期：可以很容易地通过新增数据库实例，把user库或者业务A/B/C的库拆分出来，实现增加机器增加实例就实现扩容；

个性业务数据访问垂直拆分，共性数据访问服务化下沉，只是一个很小的优化点，但对于数据库解耦却是非常的有效。

希望大家每天收获一点点，这样架构就能美好一点点。

你见过一个库里耦合了几百个表吗？

那帮转下。

数据库 rpc sql

0 人点赞