问题：

请教mysql查询时创建中间表的效率问题？

尉迟哲瀚

2024-01-15

数据库有一个学生表t_student有两个字段 id, name
我想找出name相同的所有数据的id，并根据name排序，好做对比。如

id	name
1	张三
2	李四
3	张三
4	王五
5	王五

我想找出的数据是

id	name
1	张三
3	张三
4	王五
5	王五

写下的sql如下

select id, name from t_student where name in (select name from t_student where name is not null group by name having count(*) > 1) order by name;

虽然能得到想要的数据，但是查询的速度很慢。要6s左右。
后面发现这种写法，在数据量大时，查询时间能缩短10倍以上。由6s -> 0.6s。而区别是多了个中间表。

select id, name from t_student where name in (select t.name from (select name from t_student where name is not null group by name having count(*) > 1) as t) order by name;

为了判断是否是中间表的创建导致的查询效率的提升，我换了一种写法

select ts.id, ts.name from t_student ts inner join (select t.name from t_student where name is not null group by name having count(*) > 1) as t on ts.name = t.name order by name;

通过创建中间表然后join的方式，还是很快，大概也是0.6s。
我想知道为什么这样，创建中间表为什么会比不创建要快这么多

共有1个答案

益阳平

2024-01-15

在MySQL中，查询的效率取决于多种因素，包括表的大小、索引的使用、查询的复杂性以及数据库服务器的配置等。对于您提出的问题，以下是关于创建中间表与查询效率的一些解释：

查询优化器：MySQL的查询优化器会根据查询的复杂性自动选择最佳的查询执行计划。在某些情况下，优化器可能无法选择最有效的查询方式，特别是当子查询的复杂性较高时。
临时表的使用：在某些情况下，MySQL可能会使用临时表来存储中间结果，以提高查询性能。例如，当使用GROUP BY子句时，MySQL可能会创建一个临时表来存储分组结果。这种临时表的使用可以提高查询性能，因为它可以减少对原始表的重复扫描。
中间表的选择性：在您的第二个查询中，您创建了一个中间表，其中包含不重复的name值。这个中间表的选择性更高（即，它包含的数据量更小），因此查询优化器可能更容易处理它，从而提高查询效率。
索引的使用：确保查询中用到的字段已经建立了适当的索引，可以提高查询效率。如果没有适当的索引，数据库可能需要执行全表扫描，这通常会降低查询性能。
查询的复杂性：在您的第一个查询中，您使用了嵌套子查询。这种复杂的查询结构可能导致查询优化器难以选择最佳的执行计划。通过将子查询的结果存储在临时表中，您可以简化查询结构，从而可能提高查询性能。

总的来说，创建中间表可以提高查询效率，但这并不是唯一的因素。确保正确使用索引、简化查询结构、优化数据库配置等也是提高查询效率的重要方面。如果您发现查询仍然很慢，建议使用EXPLAIN语句来分析查询的执行计划，以便更好地了解性能瓶颈并采取相应的优化措施。

类似资料：

Reg：hive中查询优化器之间的效率

请帮助我以上的问题，有没有专门的页面为hadoop和hive开发人员社区？
在mysql中使用子查询创建视图的问题

我想创建一个名为的视图，该视图显示个人的所有信息，除了他们的客户ID之外，还列出每个人在他/她的帐户中有多少余额。我的疑问是：现在，这个查询将创建视图，但当我想通过以下命令查看该视图中的信息时：它将返回一个错误：如何走出这个误区？
创建新表时房间迁移查询失败

找到：TableInfo{name='news',Columns={alias=Column{name='alias',Type='text',affinity='2',notnull=false,PrimaryKeyPosition=0,DefaultValue='null'},Selected=Column{name='select',Type='integer',affinity='3',n
我在MYSQL查询中的自连接中遇到了问题。请检查表格并查询

请通过以下查询创建表：插入查询我尝试过以下查询：表：错误输出：此图像显示重复数据：所需输出：此图将显示所需的输出：描述：当我们打开交易时，它将存储到交易表中。之后，当我们结束交易时，它将以不同的时间和数量进行另一次输入（如果交易部分结束，那么数量将不同，否则完全结束交易）。在这里，第一个条目将打开存储为时间的\u时间，第二个条目将关闭\u时间。那么，如何将两个或多个记录转换为具有
mysql创建表查询中的行大小太大错误

问题内容：我正在尝试使用以下查询创建表我收到以下错误任何人都可以让我知道如何避免此错误并使查询工作以创建表。问题答案：该表中所有字段的总大小大于限制65535，这就是为什么您会收到此错误的原因。您应该使用type而不是长字符串。全部替换为，它应该可以正常工作。或者，甚至更好的是，使用适当的数据类型而不是“太大”的数据类型。您真的不需要存储8000个字符，对吗？
MySQL中临时表的基本创建与使用教程

本文向大家介绍MySQL中临时表的基本创建与使用教程，包括了MySQL中临时表的基本创建与使用教程的使用技巧和注意事项，需要的朋友参考一下当工作在非常大的表上时，你可能偶尔需要运行很多查询获得一个大量数据的小的子集，不是对整个表运行这些查询，而是让MySQL每次找出所需的少数记录，将记录选择到一个临时表可能更快些，然后在这些表运行查询。创建临时表很容易，给正常的CREATE TABLE语句加上

请教mysql查询时创建中间表的效率问题？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档