当前位置：首页 > 面试题库 >

为什么Postgresql不对IN查询使用索引？

严天逸

2023-03-14

问题内容：

我有一个表social_accounts，facebook_id其中列上有部分索引user_id IS NULL。

如果我执行简单查询WHERE facebook_id = '123'，则使用索引：

 => EXPLAIN for: SELECT "social_accounts".* FROM "social_accounts"  WHERE (user_id IS NOT NULL) AND "social_accounts"."facebook_id" = '123'
                                                  QUERY PLAN
--------------------------------------------------------------------------------------------------------------
 Index Scan using index_social_accounts_on_facebook_id on social_accounts  (cost=0.00..8.28 rows=1 width=345)
   Index Cond: ((facebook_id)::text = '123'::text)
   Filter: (user_id IS NOT NULL)

但是如果我使用IN它进行查询，则不会使用索引：

 => EXPLAIN for: SELECT "social_accounts".* FROM "social_accounts"  WHERE (user_id IS NOT NULL) AND "social_accounts"."facebook_id" IN ('123', '456')
                                            QUERY PLAN
---------------------------------------------------------------------------------------------------
 Bitmap Heap Scan on social_accounts  (cost=8.53..16.36 rows=2 width=345)
   Recheck Cond: ((facebook_id)::text = ANY ('{123,456}'::text[]))
   Filter: (user_id IS NOT NULL)
   ->  Bitmap Index Scan on index_social_accounts_on_facebook_id  (cost=0.00..8.52 rows=2 width=0)
         Index Cond: ((facebook_id)::text = ANY ('{123,456}'::text[]))
(5 rows)

为什么在第二种情况下不使用索引？有什么办法可以加快这个查询？

（请注意，在此示例中，我已截断了数组，并测试了更多元素，但结果却相同，缓慢）

问题答案：

实际上，它正在使用索引。只是做不同的事情。

索引扫描一行一行地访问，以随机顺序从一个磁盘页面到下一个磁盘页面来回移动。

位图索引扫描首先过滤要访问的磁盘页面，然后依次访问后者。重新检查条件是因为随后需要在每个页面中过滤掉无效的行。

对于极少数的行，索引扫描是最便宜的。对于更多行，位图索引扫描变得最便宜。对于更大的行数，seq扫描最终将变得最便宜。

类似资料：

为什么索引不用于此查询？

问题内容：我有一个查询，在我认为可能不使用索引的情况下，出于好奇，我将其重现：创建一个具有1.000.000行（在中有10个不同的值，在中有500个字节的数据）的。创建一个索引并收集表统计信息：尝试获取和的不同值：不使用索引，前提是提示不会更改。我想在这种情况下不能使用索引，但是为什么呢？问题答案：我运行了Peter的原始内容并复制了他的结果。然后我应用了dcp的建议… 之所以如此
为什么Postgres没有在查询中使用索引

问题内容：我有2张表，如下所示：当我解释查询时： postgres给我这个：过了一会儿给我这个完全相同的查询（仍然不使用索引）：我的问题是：如果我仅按构成唯一索引的st值和类型值进行过滤，为什么不使用此唯一索引？问题答案：您的表没有足够的行来使用索引。它们适合放在单个磁盘页面中，因此使用cpu时间读取整个内容并筛选出行要比两次执行同一操作（一次用于索引，另一次用于数据）要快。
使用NOT IN时PostgreSQL查询速度很慢

问题内容：我有一个PostgreSQL函数，可以将查询结果返回到pgadmin结果网格中。在内部，这是一个简单的函数，使用a连接到另一个数据库并返回查询，以便我可以简单地运行它的运行就像基本的表查询一样。问题是当我使用该子句时。因此，我想运行以下查询，但它要花很多时间：我怎样才能加快速度？有什么比这种情况下的子句快的吗？问题答案：不是表-可能是一些存储过程，因此查询并不是很简单。您需要
为什么Postgres不使用索引？

问题内容：我有一张表，其中有一个名为的整数列。我在该列上有一个索引。但是似乎Postgres不想使用我的索引：知道为什么会这样吗？问题答案：因为：您选择的行太多了，以至于读取整个表都比较便宜。
Hive里面用什么代替in查询

本文向大家介绍Hive里面用什么代替in查询相关面试题，主要包含被问及Hive里面用什么代替in查询时的应答技巧和注意事项，需要的朋友参考一下解答：提示：Hive中的left semi join替换sql中的in操作
使用'in'运算符的MySQL查询：为什么用引号引起不同的结果？

问题内容：我已经将奇怪的MySQL问题归结为执行查询的两种不同方式。当您煮沸所有东西时，这种方式将返回更多结果：对WHERE子句的此更改将产生这些结果的子集：（promo_detail_store_id在MyISAM表中定义为BIGINT。）最初，该store_ids列表要长得多，而我开始将其切得越来越短，以为字符串的长度可能存在一些怪异的限制。但是不，它也适用于很小的字符串/列表。显然，

相关阅读

Hive里面用什么代替in查询使用'in'运算符的MySQL查询：为什么用引号引起不同的结果？为什么索引能提高查询速度?PostgreSQL子查询使用like PostgreSQL-查询HSTORE值的GIN索引

相关文章

为什么要使用数据库 MySQL索引底层为什么用B+树？看完这篇文章，轻松应对面试为什么要使用A/B测试？MySQL使用LIKE模糊查询为什么使用R语言做统计？

相关问答

为什么Spring data jpa不发出JOIN查询？如何使用solr对索引时不可用的数据进行索引和查询将PostgreSQL查询（函数）转换为本机查询为什么要使用对i32的不可变引用 Spring数据--为什么不能使用本地查询进行分页

相关工具

PHP-ip查询 PostgreSQL 公交查询系统火车车次查询 Label In

相关文档

TiDB in Kubernetes 用户文档 Thinking in Java Blade In Action Blade 实战你不懂JS: this 与对象原型好用的中文速查表