插值搜索(Interpolation Search)
优质
小牛编辑
144浏览
2023-12-01
插值搜索是二进制搜索的改进变体。 该搜索算法适用于所需值的探测位置。 为使此算法正常工作,数据收集应采用排序形式并均匀分布。
二进制搜索与线性搜索相比具有时间复杂性的巨大优势。 线性搜索具有Ο(n)的最坏情况复杂度,而二分搜索具有Ο(log n)。
存在可以预先知道目标数据的位置的情况。 例如,如果是电话目录,我们是否要搜索Morphius的电话号码。 在这里,线性搜索甚至二进制搜索看起来都很慢,因为我们可以直接跳转到存储名称从“M”开始的存储空间。
定位二进制搜索
在二进制搜索中,如果未找到所需数据,则列表的其余部分分为两部分,即较低和较高。 搜索是在其中任何一个中进行的。
data:image/s3,"s3://crabby-images/bbd07/bbd07d17ad350838c11705dff9c9b93d5a37600c" alt="BST第一步"
data:image/s3,"s3://crabby-images/7ccbb/7ccbb115f4933f577145d5b58391d2cea40f8547" alt="BST第二步"
data:image/s3,"s3://crabby-images/b8786/b87863d88b183ce464520aab7d58b2fc833472ee" alt="BST第三步"
data:image/s3,"s3://crabby-images/f2f4d/f2f4d07b605a6d2e06ce9e1c8f421f3bf093a93d" alt="BST第四步"
即使对数据进行排序,二进制搜索也不会利用探测所需数据的位置。
插值搜索中的位置探测
插值搜索通过计算探测位置来找到特定项目。 最初,探针位置是集合中间项目的位置。
data:image/s3,"s3://crabby-images/db133/db13384401c54cf80a6161f759f3b0b040d27162" alt="插值第一步"
data:image/s3,"s3://crabby-images/fd40e/fd40ebaf12cc0b8057fe57e071e01a761f5f2399" alt="插值第二步"
如果发生匹配,则返回该项的索引。 要将列表拆分为两部分,我们使用以下方法 -
mid = Lo + ((Hi - Lo)/(A[Hi] - A[Lo])) * (X - A[Lo])
where −
A = list
Lo = Lowest index of the list
Hi = Highest index of the list
A[n] = Value stored at index n in the list
如果中间项大于项,则再次在中间项右侧的子阵列中计算探测位置。 否则,在中间项左侧的子阵列中搜索该项。 该过程也在子阵列上继续,直到子阵列的大小减小到零。
与有利情况下的BST的Ο(log n)相比,插值搜索算法的运行时复杂度是Ο(log (log n)) 。
算法 (Algorithm)
由于它是现有BST算法的即兴创作,我们提到了使用位置探测搜索“目标”数据值索引的步骤 -
Step 1 − Start searching <b>data</b> from middle of the list.
Step 2 − If it is a match, return the index of the item, and exit.
Step 3 − If it is not a match, probe position.
Step 4 − Divide the list using probing formula and find the new midle.
Step 5 − If data is greater than middle, search in higher sub-list.
Step 6 − If data is smaller than middle, search in lower sub-list.
Step 7 − Repeat until match.
伪代码 (Pseudocode)
A → Array list
N → Size of A
X → Target Value
Procedure Interpolation_Search()
Set Lo → 0
Set Mid → -1
Set Hi → N-1
While X does not match
if Lo equals to Hi OR A[Lo] equals to A[Hi]
EXIT: Failure, Target not found
end if
Set Mid = Lo + ((Hi - Lo)/(A[Hi] - A[Lo])) * (X - A[Lo])
if A[Mid] = X
EXIT: Success, Target found at Mid
else
if A[Mid] < X
Set Lo to Mid+1
else if A[Mid] > X
Set Hi to Mid-1
end if
end if
End While
End Procedure
要了解C编程语言中插值搜索的实现, 请单击此处 。