一、需求
一个朋友接到一个需求,从大数据平台收到一个数据写入在20亿+,需要快速地加载到MySQL中,供第二天业务展示使用。
二、实现再分析
对于单表20亿,在MySQL运维,说真的这块目前涉及得比较少,也基本没什么经验,但对于InnoDB单表Insert如果内存大于数据情况下,可以维持在10万-15万行写入。但很多时间我们接受的项目还是数据超过内存的。这里使用XeLabsTokuDB做一个测试。
三、XeLabsTokuDB介绍
相对官方TokuDB的优化:
内置了jemalloc内存分配引入更多的内置的TokuDB性能指标支持Xtrabackup备份引入ZSTD压缩算法支持TokuDB的binlog_group_