当前位置: 首页 > 面试题库 >

MySQL:低基数/选择性列=如何建立索引?

孔俊爽
2023-03-14
问题内容

我需要在表(列)中添加索引,并在这篇文章中偶然发现:

多少数据库索引太多?

Quote:“话虽如此,您可以清楚地向表添加很多毫无意义的索引,这些索引不会执行任何操作。将B-
Tree索引添加到具有2个不同值的列中将毫无意义,因为它在查找数据方面不会增加任何内容。列中的值越独特,则从索引中受益越多。”

如果只有两个不同的值,索引真的没有意义吗?给定如下表(MySQL数据库,InnoDB)

Id (BIGINT)
fullname (VARCHAR)
address (VARCHAR)
status (VARCHAR)

进一步的条件:

  • 该数据库包含3亿条记录
  • 状态只能是“启用”和“禁用”
  • 1.5亿条记录的状态为启用,而1.5亿条记录的状态为禁用

我的理解是,在没有状态索引的情况下,带有select的选择where status=’enabled’将导致具有3亿条记录的完整表扫描处理?

在状态上使用BTREE索引时查询的效率如何?

我应该索引此列吗?

MySQL InnoDB提供什么替代方法(可能是其他索引),以给定示例中的“基数/选择性非常低”的方式通过“ where status =“
enabled”子句有效地查找记录?


问题答案:

您描述的索引几乎没有意义。索引是最好的使用,当你需要选择一个 相比,总行的行数。

这样做的原因与数据库访问表的方式有关。可以通过全表扫描评估表,在该表中依次读取和处理每个块。或通过rowid或键查找,其中数据库具有键/行并读取所需的确切行。

如果您使用基于主键或另一个唯一索引的where子句,例如 where id = 1,数据库可以使用索引来获取对行数据存储位置的精确引用。这显然比进行全表扫描和处理每个块更有效。

现在回到您的示例,您有一个where子句where status = 'enabled',该索引将返回150m行,并且数据库将不得不使用单独的小读取依次读取每一行。而通过全表扫描访问表允许数据库利用更有效的较大读取。

最好只进行全表扫描而不是使用索引。使用mysql时,您可以将其FORCE INDEX (idx_name)用作查询的一部分,以允许在每个表访问方法之间进行比较。

参考: http
//dev.mysql.com/doc/refman/5.5/en/how-to-avoid-table-
scan.html


 类似资料:
  • 问题内容: 在低选择性色谱柱上选择记录的策略范围是什么? 一个示例可能是订单表,多年来,您在其中构建了大量已完成的订单,但经常需要选择活动订单。订单可能会经历生命周期,例如下达,分配库存,从仓库提货,发货给客户,开票并付款。订单可能会另外被取消,保留等。大多数记录最终将处于最终状态(例如已付款),但是您可能经常需要选择已分配的订单。在这种情况下,顺序读取将很慢。 关于对 MySQL进行索引的类似问

  • 是否有任何方法可以在数据框中按索引(即整数)选择行,按列名选择列? 我尝试使用loc,但它返回一个错误,我知道iloc只适用于索引。 这是数据帧df的第一行。我愿意选择第一行,名为“Volume”的列,并尝试使用df.loc[0,'Volume']

  • 问题内容: 我想选择列名,但我不知道表结构是否会提前更改,因此它可能会发生变化,因此我不能只对带有列名的select语句进行硬编码。我也不想选择每一列。有没有简单的方法可以做到这一点? 我的想法是这两个查询的某种组合,但是我的SQL并不是那么好。 我尝试使用子选择,但没有用。似乎什么都没发生,我没有收到错误,只是没有结果 也许我需要参加吗?..无论如何,任何帮助都将是很大的,谢谢 问题答案: 试试

  • 问题内容: 我希望下面的代码向我显示表中交换列为null但结果集显示0行的所有记录。知道为什么吗? 问题答案: 也许您将其解释为不相同,但请尝试此操作 但如果仍然无法获得价值,也许它上面有空格,那么您应该这样做,

  • 本文向大家介绍MySQL 按列名选择,包括了MySQL 按列名选择的使用技巧和注意事项,需要的朋友参考一下 示例 询问 结果            

  • 本文向大家介绍MySQL 选择所有列(*),包括了MySQL 选择所有列(*)的使用技巧和注意事项,需要的朋友参考一下 示例 询问 结果 您可以通过执行以下操作从一个连接的一个表中选择所有列: 最佳实践*除非正在调试或获取row(s)关联数组,否则不要使用,否则架构更改(ADD / DROP /重新排列列)可能会导致讨厌的应用程序错误。另外,如果提供结果集中所需的列列表,MySQL的查询计划程序通