当前位置：首页 > 软件库 > 数据库相关 > 数据库调整和优化 >

smlar

PostgreSQL 相似度查找的扩展

授权协议未知

开发语言 C/C++

所属分类数据库相关、数据库调整和优化

软件类型开源软件

地区不详

投递者夹谷山

操作系统跨平台

开源组织无

适用人群未知

软件概览

smlar 是 PostgreSQL 的一个扩展，用于实现高效的相似度查找。

使用案例

海量数据,海明距离高效检索(smlar) - 阿里云RDS PosgreSQL最佳实践

标签 PostgreSQL , 海明距离 , smlar , GiST索引背景 http://www.cnblogs.com/lushilin/p/6549665.html SimHash的应用通过上面的步骤，我们可以利用SimHash算法为每一个网页生成一个向量指纹，那么问题来了，如何判断2篇文本的相似性？这里面主要应用到是海明距离。（1）什么是海明距离两个码字的对应比特取值不同的比特
PostgreSQL 相似搜索插件介绍大汇总 (cube,rum,pg_trgm,smlar,imgsmlr,pg_similarity) (rum,gin,gist)...

标签 PostgreSQL , cube , rum , pg_trgm , smlar , imgsmlr , pg_similarity , gin , gist , 倒排 , 相似 , 向量 , 特征 , 图像 , 文本 , 字符串 , 全文检索背景在搜索业务场景中，相似搜索是一个非常常见的需求。 PostgreSQL有很多插件、索引可以支持海量数据的高效率搜索。以下是一些案例：《G
海量数据,海明距离高效检索(smlar) - 阿里云RDS PosgreSQL最佳实践-阿里云开发者社区

标签 PostgreSQL , 海明距离 , smlar , GiST索引背景 SimHash的应用通过上面的步骤，我们可以利用SimHash算法为每一个网页生成一个向量指纹，那么问题来了，如何判断2篇文本的相似性？这里面主要应用到是海明距离。 (1)什么是海明距离两个码字的对应比特取值不同的比特数称为这两个码字的海明距离。在一个有效编码集中,任意两个码字的海明距离的最小值称为该编码集的海
PostgreSQL 相似搜索插件介绍大汇总 (cube,rum,pg_trgm,smlar,imgsmlr,pg_similarit...

标签 PostgreSQL , cube , rum , pg_trgm , smlar , imgsmlr , pg_similarity , gin , gist , 倒排 , 相似 , 向量 , 特征 , 图像 , 文本 , 字符串 , 全文检索背景在搜索业务场景中，相似搜索是一个非常常见的需求。 PostgreSQL有很多插件、索引可以支持海量数据的高效率搜索。以下是一些案例：《G
相似搜索插件介绍大汇总 (cube,rum,pg_trgm,smlar,imgsmlr,pg_similarity) (rum,gin,g

背景在搜索业务场景中，相似搜索是一个非常常见的需求。 PostgreSQL有很多插件、索引可以支持海量数据的高效率搜索。以下是一些案例：《Greenplum 轨迹相似(伴随分析)》《PostgreSQL 相似文本检索与去重 - (银屑病怎么治？银屑病怎么治疗？银屑病怎么治疗好？银屑病怎么能治疗好？)》《PostgreSQL 相似搜索分布式架构设计与实践 - dblink异步调用与多机并行

相关资料

查找两个字符串之间的相似性度量

如何获得一个字符串与Python中的另一个字符串相似的概率？我想得到一个十进制值，如0.9（意味着90%）等。最好使用标准Python和库。 e、 g。
Python-查找两个字符串之间的相似性度量

问题内容：如何获得字符串与Python中的另一个字符串相似的概率？我想要一个像0.9（表示90％）之类的十进制值。最好使用标准Python和库。例如问题答案：有一个内置的。使用它：
如何优化查找相似性？

我有一组由浮点向量表示的30000个文档。所有向量都有100个元素。我可以通过使用向量之间的余弦度量来比较两个文档来找到相似性。问题是找到最相似的文档需要很多时间。有什么算法可以帮助我加快速度吗？编辑现在，我的代码只计算第一个向量和所有其他向量之间的余弦相似度。大约需要3秒钟。我想加快速度；)算法不一定要精确，但应该给出与全搜索相似的结果。每个向量的元素之和等于1。
余弦相似度

问题内容：我计算了两个文档的tf / idf值。以下是tf / idf值：这些文件就像：如何使用这些值来计算余弦相似度？我知道我应该计算点积，然后找到距离并除以点积。如何使用我的值来计算？还有一个问题：两个文档的字数相同是否重要？问题答案： a * b是点积一些细节：是。在某种程度上，a和b必须具有相同的长度。但是a和b通常具有稀疏表示，您只需要存储非零条目，就可以更快地计算范数
以编程方式查找相似的颜色

问题内容：我在Java中有一个缓冲的图像，我想根据颜色值记录每个像素与另一个像素的相似程度。因此具有“相似”颜色的像素将具有较高的相似度值。例如，红色和粉红色的相似度值为1000，但是红色和蓝色的相似度为300或更小。我怎样才能做到这一点。当我从缓冲的图像像素获得RGB时，它返回一个负整数，我不确定该如何实现它。问题答案：首先，如何获得整数值？获得RGB值后，您可以尝试（（r2-r1）
如何使用nodejs查找相似文本

我正在尝试开发一个简单的搜索引擎，以获得匹配的句子在一个文本文件与nodejs，但我想改进我的搜索引擎，以获得相似的文本，而不仅仅是准确的文本，有什么建议，我可以如何做到这一点？这是我的代码：
相似度得分-Levenshtein

问题内容：我用Java实现了Levenshtein算法，现在可以通过算法进行更正，也就是成本。这确实有一点帮助，但并没有太大帮助，因为我希望将结果表示为百分比。所以我想知道如何计算那些相似点。我也想知道你们的人民是如何做的以及为什么。问题答案：两个字符串之间的Levenshtein距离定义为将一个字符串转换为另一个字符串所需的最小编辑次数，允许的编辑操作为单个字符的插入，删除或替换。（维
在Elasticsearch中查找最相似的整数数组

问题内容：改写：在我的项目中，我有图像。每个图像有5个标签，范围为[1,10]。我用Elasticsearch上传了这些标签：我将这些文件加载到类型为“ img”的索引“ my_project”中的elasticsearch中：我上传的其他示例文件：在我的应用程序中，向量要长得多，但是具有固定数量的唯一元素。我喜欢这些文件中的20M。现在，我想找到给定向量的相似文档。向量具有更多公

smlar

同类工具

相关阅读

相关文章

相关问答

相关文档