当前位置:首页 > 每日看点 > 正文内容

Mysql为什么只能支持2000w左右的数据量?

卡卷网10个月前 (01-02)每日看点152

MySQL为什么“只能”支持2000w左右的数据量?

首先,这个问题有点冤枉MySQL了。

MySQL根本没跟你说它只能撑到2000w,是你用得不对!这个2000w的“天花板”其实不是MySQL的硬性,而是硬件、数据库设计、以及配置调优没到位,自己给自己挖了坑。

要搞清楚这个问题,我们得从<>存储引擎原理、硬件、MySQL配置几个层面扒一扒。

1.<>+树、16k数据页,这锅不是它的

很多人喜欢拿+树和16K数据页出来背锅,说什么“一个数据页存不下多少条数据,+树层数多了就崩了”。这种说法听着有点意思,但问题是,+树从设计上就支持动态扩展,根本不怕你数据量大。数据多了,它就节点,保证树的层级增长在可控范围内。

<>+树能撑多少数据?

举个例子:

    假设一个数据页是16K,每个索引项占100字节,那一个节点能存大约160条索引。如果是3层+树(根节点-中间节点-叶子节点),第一层指向160个第二层节点,每个第二层节点又指向160个叶子节点。那整个树能存多少条数据?<>160×160×160=4096000条数据。但实际上,<>4层+树能轻松撑到几十亿条数据,根本不是问题。

所以,+树的设计可以随数据量增加自动扩展,性能只会随层级增加稍微有点延迟,但不会突然“”。问题不在它。

[AT大佬写的刷题笔记,让我offer拿到手软](这位AT大佬写的Leetcode刷题笔记,让我offer拿到手软)

2.<>内存才是问题的核心:InnoD的ufferPool

正让人觉得“2000w就顶不住了”的核心,是<>内存缓存不够。InnoD存储引擎通过<>ufferPool来数据的缓存,这个地方的大小直接决定了你查询的效率。

<>ufferPool到底干嘛的?

当你执行查询时:

    MySQL先看<>ufferPool(也就是内存)里有没有你需要的数据页。<>有:直接从内存返回,速度飞快。<>没有:只能从磁盘加载数据页到ufferPool,然后再返回数据。

问题来了:<>内存是有限的,假设你的内存只有8G,而数据总量是100G,ufferPool只能缓存一部分,剩下的查询每次都得访问磁盘。磁盘速度再快,频繁IO也顶不住啊!

<>缓存命中率低,性能自然差

    数据量越大,缓存的命中率就越低。一旦命中率低,你的查询就会频繁触发磁盘IO,读写速度直接掉到地板上。

这就好你脑袋里的短期记忆只能装10条信息,但老板一天给你1000条任务。你不可能每条任务都能记住,只能反复翻任务清单,效率能高才怪。

<>解决方法

    <>加内存!加ufferPool!ufferPool大小可以通过参数innod_uffer_pool_size设置。一般建议设置为总内存的50%-75%,如有32G内存,可以把ufferPool设成24G。<>分区分表,减少单表数据量(后面详细讲)。

3.<>磁盘性能:别再用机械硬盘了!

很多人用MySQL出问题,原因之一是磁盘性能拖后腿。如果你用的是传的机械硬盘(HDD),那随机读写速度慢得让人怀疑人生。在高并发场景下,机械硬盘根本扛不住频繁的IO作。

<>为什么磁盘性能这么重要?

MySQL的数据最终存储在磁盘上,查询的时候如果ufferPool缓存不命中,就得从磁盘加载数据页。如果你的磁盘太慢,那读取速度直接拖垮性能。尤其是+树的索引查找,涉及到多个数据页的加载,每次IO的延迟都会被放大。

<>解决方法

    换成<>SSD或者更高级别的企业级存储(如NVMeSSD)。如果是云,选择高IOPS的存储服务。

一句话,硬件别抠门,省下的预算会让你多加几倍班。

[AT大佬写的刷题笔记,让我offer拿到手软](这位AT大佬写的Leetcode刷题笔记,让我offer拿到手软)

4.<>单表设计问题:2000w的数据压死了一张表

有时候MySQL撑不住,不是数据库的锅,而是<>表设计得太随意。一张表直接存2000w条记录,再加上复杂的查询和写入,表锁、索引膨胀这些问题会一起扑向你。

<>单表的问题

    <>索引太大:MySQL的索引是跟数据一起存放的,2000w条记录的索引文件可能有几十G,索引查找的效率下降。<>写入冲突:高并发写入会导致频繁的锁等待,性能雪崩。

<>解决方法:分区分表

    <>分区表把一张表按照某种规则分成多个分区,如按时间分区。CREATETALEorders(idINTNOTNULL,order_dateDATENOTNULL,PRIMARYKEY(id,order_date))PARTITIONYRANGE(YEAR(order_date))(PARTITIONp2019VALUESLESSTHAN(2020),PARTITIONp2020VALUESLESSTHAN(2021),PARTITIONp2021VALUESLESSTHAN(2022));查询时,MySQL只扫描对应分区,性能大大提升。<>分库分表如果分区表还不够,那就直接把数据拆分到不同的数据库和表里。如把用户ID按哈希值取模拆分成10张表。

5.<>查询优化:索引别乱用

MySQL索引用得好是性能神器,用得不好就是灾难。很多人一上来就随便给表加索引,觉得“多加索引=高性能”,结果不仅没提升性能,反而查询更慢。

<>常见索引问题

    <>过多的单字段索引:每个查询都涉及多个字段,但每个字段的索引是的,MySQL无法充分利用这些索引。<>大字段加索引:如TEXT或LO字段,加了索引反而拖累性能。

<>优化方法

    <>复合索引:将多个查询条件组合成一个索引。CREATEINDEXidx_user_orderONorders(user_id,order_date);<>覆盖索引:查询只返回索引列,避免访问数据页。SELECTuser_id,order_dateFROMordersWHEREuser_id=123;

6.<>MySQL配置调优:用对工具很重要

MySQL默认配置较保守,很多参数需要根据业务场景调整。如:

    <>innod_uffer_pool_size:前面说了,内存大了性能才快。<>innod_log_file_size:增大redolog文件,减少写入时的性能瓶颈。<>query_cache_size:可以缓存少量高频查询结果,减少重复计算。

总结:问题到底在哪?

所谓“2000w数据的”,并不是MySQL自己的硬性,而是以下几个问题的叠加效应:

    <>内存缓存不够,ufferPool装不下那么多数据。<>磁盘性能太差,频繁的磁盘IO成了瓶颈。<>表设计不合理,单表数据量过大导致索引膨胀和写入冲突。<>查询没优化,索引用得乱七八糟。

<>解决方案总结

问题解决方法缓存不足增大ufferPool,提升内存容量磁盘性能差换成SSD,或者使用高IOPS的云存储表数据量过大使用分区表或分库分表查询慢优化索引,使用复合索引和覆盖索引配置不合理调整innod_uffer_pool_size等参数

所以别再吐槽MySQL不行了,只要用对方法,别说2000w数据,2亿都能稳稳扛住!

最近无意间获得一份阿里大佬写的刷题笔记,一下子打通了我的任督二脉,进大厂原来没那么难。

链接:s://pan.aidu/s/1UECE5yuaoTTRpJfi5LU5TQ密码:he

不会有人刷到这里还想白嫖吧?点赞对我的非常重要!在线求赞。加个关注我会非常感激!

@苏三说技术

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/6179.html

分享给朋友:

相关文章

个人站长为什么越来越少了?个人网站还能做吗?

个人站长为什么越来越少了?个人网站还能做吗?

在互联网快速发展的浪潮中,个人站长曾经有过辉煌的时代,但如今却面临着诸多困境,甚至走向 “死亡”。一、竞争激烈,难以立足如今的互联网行业,巨头林立,各大平台凭借着雄厚的资金、技术和资源优势,占据了绝大部分市场份额。无论是搜索引擎、社交媒体还...

我觉得华为Mate60Pro明明配置不高,为什么还是有那么多人买呢?

我也好奇啊,所以闲聊时,我问了我们公司的副总,我说Mate60pro配置这么拉胯你怎么还买啊?他一脸疑惑的看着我,配置?什么配置?我这手机信号挺好的啊?我们总经理用的是去年华为出的折叠手机,花了一万多,我也想问问他同样的问题,但奈何一直没有...

你每天用来涨知识的手机应用程序有哪些?

你每天用来涨知识的手机应用程序有哪些?

经过深度使用和测评,从100个APP中选出的这35个超实用的app,每一个都是最硬核最有料的涨知识神器!每天打开看看,能让你提神醒脑,眼界大开,成为朋友聚会上的话题王者!双击屏幕取走哦~先放上全部APP目录,有新闻资讯类、英语学习类、读书类...

如何做电商行业?

如何做电商行业?

“如何做电商*开网店”跟“如何找老婆”一样,没概况条件、没明确标准,就是扯犊子。我把话题具体一点说:具备“两三万”启动资金、掌握“选品+上架优化”基础技能,小则月入三五千、多则上万。跟摆地摊一样,有进货的钱、也不怕苦不怕累、稍微有点生意头脑...

国内AI大模型已近80个,哪个最有前途?

国内AI大模型已近80个,哪个最有前途?

题主说错了,不是80个,是168个!虽然“最有前途”不好说,但是我可以帮题主排除一些错误方向:开源大模型一定比闭源的有前途吗?参数量大的模型一定就比小模型有前途吗?榜单排名高的大模型一定更有前途吗?2024年3月更新,243个大模型中有哪几...

什么时候你意识到做技术永无出路?

什么时候你意识到做技术永无出路?

2016年,帮一个朋友的忙,写了个软件给他的工作室用, 象征性的收了5000块钱。大概过了三四年吧,他酒后吐真言,这个软件在他这个细分行业,很有用,他这几年把我写的这个软件卖了很多份出去,收益远超30万。因为是离线软件,给他的就是一个exe...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。