当前位置：首页 > 软件库 > 程序开发 > 数学计算 >

Word2vec-Lucene

为Lucene定制word2vec

授权协议 Apache 2.0

开发语言 Java

所属分类程序开发、数学计算

软件类型开源软件

地区不详

投递者谷梁嘉运

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

word2vec（word to vector）是一个将单词转换成向量形式的工具，Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包，Word2vec-Lucene是用于将Lucene检索到的内容转换成向量形式的工具。

使用案例

学习笔记CB011:lucene搜索引擎库、IKAnalyzer中文切词工具、检索服务、查询索引、导流、word2vec

影视剧字幕聊天语料库特点，把影视剧说话内容一句一句以回车换行罗列三千多万条中国话，相邻第二句很可能是第一句最好回答。一个问句有很多种回答，可以根据相关程度以及历史聊天记录所有回答排序，找到最优，是一个搜索排序过程。 lucene+ik。lucene开源免费搜索引擎库，java语言开发。ik IKAnalyzer，开源中文切词工具。语料库切词建索引，文本搜索做文本相关性检索，把下一句取出作答案候选集
学习笔记CB011:lucene搜索引擎库、IKAnalyzer中文切词工具、检索服务、查询索引、导流、word2vec...

影视剧字幕聊天语料库特点，把影视剧说话内容一句一句以回车换行罗列三千多万条中国话，相邻第二句很可能是第一句最好回答。一个问句有很多种回答，可以根据相关程度以及历史聊天记录所有回答排序，找到最优，是一个搜索排序过程。 lucene+ik。lucene开源免费搜索引擎库，java语言开发。ik IKAnalyzer，开源中文切词工具。语料库切词建索引，文本搜索做文本相关性检索，把下一句取出作答案候选集
这个工具从Lucene索引提取词向量

word2vec for Lucene "word2vec for Lucene" extracts word vectors from Lucene index. strength and weakness strength You don't need to provide a text file besides Lucene index. You don't need to normaliz
lucene tfidf

lucene tfidf score获取 idf indexReader.docFreq(new Term(FIELD, “中国”)) indexReader.maxDoc() tf Terms terms = indexReader.getTermVector(docID, TEXT_FIELD); TermsEnum termsEnum = terms.iter

Word2vec-Lucene

同类工具

相关阅读

相关文章

相关问答

相关文档