当前位置: 首页 > 软件库 > 大数据 > 数据处理 >

Vespa

开放大数据服务引擎
授权协议 Apache
开发语言 Java C/C++
所属分类 大数据、 数据处理
软件类型 开源软件
地区 不详
投 递 者 吉栋
操作系统 跨平台
开源组织 Yahoo
适用人群 未知
 软件概览

Vespa 是雅虎开源的针对大数据集的低延迟计算引擎。它存储和索引数据,以便在服务时间对数据进行查询、选择和处理。

Vespa 可实现:

  • 使用类似 sql 的查询和非结构化搜索来选择内容

  • 组织所有匹配以生成数据驱动页面

  • 通过手动或机器学习的相关性模板对匹配结果排序

  • 每秒数千次实时写入持久性数据

Vespa 可用于:

  • 应用搜索

  • 个性化推荐

  • 导航页

  • 实时数据显示

  • 数据&组排序

架构图

 相关资料
  • 1.自我介绍 2.rdd变dataframe,再变dataset中间发生的过程 3.项目拷打 4.说说文本处理方法 5.说说数据采集经历 6.颜色分类,操这题还没写对,麻了

  • 主要内容:1.开源OLAP综述,2.开源数仓解决方案1.开源OLAP综述 如今的开源数据引擎多种多样,不同种类的引擎满足了我们不同的需求。现在ROLAP计算存储一体的数据仓库主要有三种,即StarRocks(DorisDB),ClickHouse和Apache Doris。应用最广的数据查询系统主要有Druid,Kylin和HBase。MPP引擎主要有Trino,PrestoDB和Impala。这些引擎在行业内有着广泛的应用。 在云资源层,主要有E

  • 我在linux/amd64上使用go1.15.14编译了Vespa版本7.534.29,如何将其降级到7.220.14,因为这会导致我的自定义搜索程序在生产中无法工作

  • 我正在设计一个微服务架构中的评审分析平台。 应用程序如下所示; null null 问题在于,验证服务需要获取site-a的所有评论,应用验证规则并生成错误(如果有的话)。我知道共享数据库模式和实体打破了微服务体系结构。 一个可能的解决方案是 每当验证服务需要对站点进行审查时,它就会请求网关,网关会将请求重定向到审查服务并采取响应。 这种方法的两个可能缺点是 验证服务是否知道网关?是否会带来依赖?

  • 我正在构建一个基于Spring云的微服务ML管道。我有一个数据摄取服务,它(当前)从SQL接收数据,这些数据需要被预测服务使用。 普遍的共识是写入应该使用kafka/Rabbitmq使用基于异步消息的通信。 我不确定的是如何编排这些服务? 我是否应该使用API网关来调用启动管道的摄取?

  • 问题内容: Java是否有SMB / CIFS服务器的开放实现?我唯一能找到的实现是Alfresco的实现,但它不是开源的。 一个相关的问题:假设没有这样的实现,我很惊讶没有库提供SMB的子集,例如用于简单文件传输。我的直觉是,实现一个简单的服务器并不会很困难(但是,实现像Samba这样的完整解决方案当然会非常困难)。似乎没有人做到这一点的事实使我感到怀疑,这比我想象的要难。是否因为困难或没有人在