TF-Ranking

排序学习的可扩展 TensorFlow 库
授权协议 Apache
开发语言 Python
所属分类 神经网络/人工智能、 机器学习/深度学习
软件类型 开源软件
地区 不详
投 递 者 尹辰沛
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

谷歌 AI 发布了最新成果 TF-Ranking,它是一个专门针对排序学习(learning-to-rank)应用的可扩展 TensorFlow 库。TF-Ranking 快速且易用,并能创建高质量的排序模型,对构建 web 搜索或新闻推荐等基于真实世界数据的排序系统感兴趣的人,都可以将 TF-Ranking 作为强稳的、可扩展的解决方案。

TF-Ranking 提供了一个统一的框架,该框架包括一套最先进的排序学习算法,并且支持 Pairwise 和 Listwise 损失函数、多项目评分、排序度量优化和无偏见排序等等。

TF-Ranking 快速且易用,并能创建高质量的排序模型。该统一框架让机器学习研究人员、实践者和爱好者能够在单个库中评估和选择一系列不同的排序模型。此外,谷歌 AI 团队坚信一个有用的开源库,它的关键不仅在于提供合理的默认值(sensible default),而且还在于能够授权用户开发自定义模型。为此,他们提供了灵活的 API,让用户可以在 API 中定义和插入自定义的损失函数、评分函数和指标。

  • tf-idf, short for term frequency-inverse document frequency.  The tf-idf value increases proportionally to the number of times a word appears in the document, but is offset by the frequency of the wor

  • 1、什么是相关性 相关性描述的是⼀个⽂档和查询语句匹配的程度。ES 会对每个匹配查询条件的结果进⾏算分_score。_score 的评分越高,相关度越高 对于信息检索工具,衡量其性能有3大指标: 查准率 Precision:尽可能返回较少的无关文档 查全率 Recall:尽可能返回较多的相关文档 排序 Ranking:是否能按相关性排序 前两者更多与分词匹配相关,而后者则与相关性的判断与算分相关。

  • TF-IDF(Term Frequency-Inverse Document Frequency)算法是常用的一种文本关键词或者文本特征的提取方法。相比于单单考虑单词的出现频率(TF),TF-IDF引入了逆文档频率(IDF),使得我们提取的关键词更加有代表性,而代表性也是TF-IDF方法关注的焦点。 TF-IDF理论 其主要思想是:如果在一篇文章中一个词的出现频率高,并且语料库中其他文章包含这个词

  • 什么是TF-IDF TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要

 相关资料
  • TensorFlow安装 初识Tensorboard SKflow 觉得我的文章对您有帮助的话,就给个star吧~ 土豪可以打赏支持,一分也是爱

  • TensorFlow 是一种表示计算的方式,直到请求时才实际执行。 从这个意义上讲,它是一种延迟计算形式,它能够极大改善代码的运行。 翻译自:https://learningtensorflow.com/

  • 扩展练习 Challenge 1(需要编程) 扩展proj4,增加syscall功能,即增加一用户态函数(可执行一特定系统调用:获得时钟计数值),当内核初始完毕后,可从内核态返回到用户态的函数,而用户态的函数又通过系统调用得到内核态的服务(通过网络查询所需信息,可找老师咨询。如果完成,且有兴趣做代替考试的实验,可找老师商量)。需写出详细的设计和分析报告。完成出色的可获得适当加分。 提示: 规范一下

  • 一、背景 排序对于MR来说是个核心内容,如何做好排序十分的重要,这几天写了一些,总结一下,以供以后读阅。 二、准备 1、hadoop版本是0.20.2 2、输入的数据格式(这个很重要,看清楚格式),名称是secondary.txt: abc123 acb124 cbd523 abc234 nbc563 fds235 khi234 cbd675 fds971 hka862 ubd621 khi123

  • 有关TensorFlow与其他框架的详细对比可以阅读: https://zhuanlan.zhihu.com/p/25547838   01 TensorFlow的编程模式 编程模式分为两种:命令式编程与符号式编程 前者是我们常用的C++,java等语言的编程风格如下 命令式编程看起来逻辑非常清晰,易于理解。而符号式编程涉及较多的嵌入和优化,如下 执行相同的计算时c,d可以共用内存,使用Tenso

  • Flarum 是简约的,同时也是高度可扩展的。实际上,Flarum 附带的大部分功能都是扩展程序。 这种方法使得 Flarum 具有极高的可定制性。您可以禁用任何您不需要的功能,并安装其他扩展,打造更适合您的社区。 如果您想了解更多关于 Flarum 的理念,我们在核心中包含了哪些功能,或者您想制作自己的扩展,请查看我们的 扩展文档。 本文将重点讨论从论坛管理员的角度管理扩展。 Flarum 有一