当前位置: 首页 > 软件库 > 程序开发 > 常用工具包 >

keyword-extract

URL 关键词提取工具
授权协议 Apache
开发语言 Java
所属分类 程序开发、 常用工具包
软件类型 开源软件
地区 国产
投 递 者 屠嘉勋
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

单文件、无三方依赖、支持在线规则升级、非标准协议的 URL 关键词提取工具。

使用

<dependency>
  <groupId>com.ecfront</groupId>
  <artifactId>keyword-extract</artifactId>
  <version>1.4</version>
</dependency>
// 关键词提取
KeyWordExtract.Result result = KeyWordExtract.extract(url);

// 使用在线规则
KeyWordExtract.loadOnlineRules("https://raw.githubusercontent.com/gudaoxuri/keyword-extract/master/src/main/resources/kwe-rules.txt");

规则配置说明

本地规则文件默认已打到 jar 中,如要修改可在 classpath 根目录中创建 kwe-rules.txt 文件,此文件会覆盖默认规则。

使用在线规则会覆盖自定义规则。

# 一行一条规则,配置项以|分隔
# 规则分一般规则和自定义规则,后者使用js代码处理

# 一般规则
<名称>|<host>|<关键字所在位置,query:查询条件中,path:url路径中>|<对于query位置指定关键字的key,对于path位置指定以/分隔的偏移量>|<解码方式,目前只支持decodeURI,空>|<编码>

e.g. :

百度|www.baidu.com|query|wd|decodeURI|UTF-8
搜狗微信|weixin.sogou.com|query|query|encodeURI|UTF-8
苏宁|search.suning.com|path|0|decodeURI|UTF-8

# 自定义规则
<名称>|<host>|<js代码,入参为uri,返回值为result>

e.g. :

微博|s.weibo.com|var uri = decodeURI(decodeURI(uri)); var kv = uri.split("/")[2]; result = kv.split("&Refer=")[0];

# 自定义协议支持

app://app1/somepath?q=URL关键词提取
custom://custom1/somepath?q=URL关键词提取
  • In the modern time, Search engine came into the life of everybody likeGoogle, Baidu, etc. Wiskey also wants to bring this feature to his image retrieval system. Every image have a long description, wh

  • In C++, the compiler is allowed to make one implict conversion to resolve the parameters to a function. What this means is that the compiler can use single parameter constructors to convert from one t

  • 之前内容的整理 要求:第一: 首先找出具有proposal性质的paper,归纳出经典的方法有哪些. 第二:我们如果想用的话,哪种更实用或者易于实现? 哪种在研究上更有意义.   第一,      较好较全面地介绍keyword extraction的经典特征的文章《Finding Advertising Keywords on Web Pages》. 基于概念的keywords提取,使用概念、分

  • 代码版本:3.6.3  关键字  关键字是指Python中的保留字,是已经规定好的有其固定作用的词,定义变量时不能与关键字重名。关键字不是变量,只是一种有特殊用处的词语。keyword模块中的kwlist是一个列表,存放了Python中所有的关键字(str格式)。关键字其实很好分辨,就是编写代码时那些不曾定义过就直接使用的单词(不是符号),而且使用时决不能带括号,那就一定是关键字,用这个规则,再回

  • import Java Keyword with Examples The import keyword makes one class or all classes in a package visible in the current Java source file. Imported classes can be referenced without the use of fully−qu

  • linux:kernel SmartOS: os git:版本控制 Indeed.com:职位发布

  • SELECT -- Select the season and max goals scored in a match season, MAX(home_goal + away_goal) AS max_goals, -- Select the overall max goals scored in a match (SELECT MAX(home_goal + away

  • boost match 百度搜索_wget 指定输出目录 百度搜索_bjam 只编译指定库 百度搜索_easy handle 多次使用 site:blog.csdn.net libcurl curl stl str_replace boost replace 百度搜索_boost 1.43 编译

  • 原文地址:http://www.webmasterworld.com/forum8/1560.htm Guide Index Basic Definition Attributes of a keyphrase Overall market or popularity. Relevancy with respect to the business. Overall competition. Lan

  • abstract Keyword in Java with Examples The abstract keyword is used to declare a class or a method as abstract. An abstract class is a class that is declared abstract means it may or may not include a

  • The this keyword show page contents See sections 5H and 7F of the book. This page has been translated intoFrench,Russian,and Chinese. One of the most powerful JavaScript keywords is this. Unfortunatel

  • Python中调用函数时,有时会报SyntaxError: non-keyword arg after keyword arg错误。 这通常是因为函数中定义了部分参数的默认值,Python中*arg表示任意多个无名参数,类型为tuple(元组),**kwargs表示关键字参数,为dict(字典),因此没有默认值的参数,即*arg 要放在前面,**kwargs 要放在后面,出现这个错误后,可以在有默

  • 常见关键字举例 用于定义数据类型的关键字 | class | interface | enum | @interface | byte | short | int | long | char | float | double | boolean | void 用于定义访问权限修饰符的关键字 | public | protected | private 用于定义类、函数、变量修饰符的

 相关资料
  • 关键字参数 Stylus支持关键字参数,或"kwargs". 允许你根据相关参数名引用参数。 下面这些例子功能上都是一样的。但是,我们可以在列表中的任何地方放置关键字参数。其余不键入参数将适用于尚未得到满足的参数。 body { color: rgba(255, 200, 100, 0.5); color: rgba(red: 255, green: 200, blue: 100, alp

  • void是JavaScript中的一个重要关键字,可以用作在单个操作数之前出现的一元运算符,该操作数可以是任何类型。 此运算符指定要计算的表达式而不返回值。 运算符计算给定的表达式,然后返回undefined。 以下是相同的语法。 void expression 无效并立即调用函数表达式 使用立即调用的函数表达式时,void可用于强制将function关键字视为表达式而不是声明。 考虑以下示例

  • 到目前为止,我们还没有讨论任何关联数据结构,即可以将特定值(或多个值)与密钥相关联的数据结构。 不同的语言使用不同的名称来调用这些功能,如字典,散列,关联数组等。 在Elixir中,我们有两个主要的关联数据结构:关键字列表和映射。 在本章中,我们将重点关注关键字列表。 在许多函数式编程语言中,通常使用2项元组的列表作为关联数据结构的表示。 在Elixir中,当我们有一个元组列表并且元组的第一项(即

  • 关键字参数允许您指定哪些值与哪个特定参数一起使用。 使用&key符号表示。 将值发送到函数时,必须在值前面加上:parameter-name. 以下示例说明了该概念。 例子 (Example) 创建一个名为main.lisp的新源代码文件,并在其中键入以下代码。 (defun show-members (&key a b c d ) (write (list a b c d))) (show-me

  • 本文向大家介绍python提取内容关键词的方法,包括了python提取内容关键词的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了python提取内容关键词的方法。分享给大家供大家参考。具体分析如下: 一个非常高效的提取内容关键词的python代码,这段代码只能用于英文文章内容,中文因为要分词,这段代码就无能为力了,不过要加上分词功能,效果和英文是一样的。 希望本文所述对大家的Pyth

  • OpenNLP是否能够从内容中提取关键字?如果是,如何?如果没有,我应该使用哪个工具? 我想自动标记内容。例如 杰西卡·查斯坦透露,已经与漫威就一个未公开的角色进行了会面,尽管这位明星已经证实这不是漫威上尉。“我们已经讨论过在未来调整我们的力量,”查斯坦告诉MTV她与工作室的关系。“我的事情是这样的...如果你要出演超级英雄电影,你只有一次机会。”“你永远是那个角色。那么为什么要拍超级英雄电影,扮

  • 描述 (Description) !important关键字用于覆盖特定属性。 当它在mixin调用之后放置时,它将所有继承的属性标记为!important 。 以下示例演示了在LESS文件中使用!important keyword - <html> <head> <link rel = "stylesheet" href = "style.css" type = "text/c

  • 问句解析的过程 一般问句解析需要进行分词、词性标注、命名实体识别、关键词提取、句法分析以及查询问句分类等。这些事情我们从头开始做无非是重复造轮子,傻子才会这么做,人之所以为人是因为会使用工具。网络上有关中文的NLP工具有很多,介绍几个不错的: 第一个要数哈工大的LTP(语言技术平台)了,它可以做中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、 高效、精准的自然语言处理技术 第二