当前位置: 首页 > 工具软件 > Txtai > 使用案例 >

24----txtai 4.0 中的新功能

逑翰翮
2023-12-01

txtai 4.0 带来了许多主要的功能增强,最重要的是能够在 txtai 中存储完整的文档内容和文本。本文将通过示例涵盖所有更改。

安装依赖
安装txtai和所有依赖项。
pip install txtai
内容存储
到目前为止,使用 txtai,一旦文本被矢量化,就无法再追溯到输入文本。仅存储文档 ID 和向量。结果由 ID 和分数组成。开发人员有责任解决与外部数据存储的匹配问题。

txtai 4.0 带来了重大的范式转变。内容现在可以与嵌入向量一起存储。这为 txtai 开启了许多激动人心的可能性!

让我们看看下面的经典 txtai 示例。
from txtai.embeddings import Embeddings

data = [“US tops 5 million confirmed virus cases”,
“Canada’s last fully intact ice shelf has suddenly collapsed, forming a Manhattan-sized iceberg”,
“Beijing mobilises invasion craft along coast as Taiwan tensions escalate”,
“The National Park Service warns against sacrificing slower friends in a bear attack”,
“Maine man wins $1M from $25 lottery ticket”,
“Make huge profits without work, earn up to $100,000 a day”]

Create

 类似资料: