当前位置: 首页 > 软件库 > 程序开发 > 搜索引擎 >

TngouDB

中文搜索引擎数据库
授权协议 GPL
开发语言 Java
所属分类 程序开发、 搜索引擎
软件类型 开源软件
地区 国产
投 递 者 傅越
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

TngouDB中文索引数据库是天狗网(tngou.net)开发的中文搜索引擎数据库,用于天狗农业网的农业搜索引擎。天狗希望基于开源的力量,把TngouDB打造成为一个专门的中文索引NoSQL数据库。

简介
TngouDB是基于JAVA而开发的跨平台数据库,底层采用Lucene(存储引擎)、IK(分词)、Netty(通信)等 而打造的网络数据库。TngouDB直接简化的Lucene的相关API的调用,使用SQL语句实现数据的CRUD操作。

结构
TngouDB的数据存储还是以关系型数据库结构存储,但TngouDB不支持级联查询,所以TngouDB不是一个标准的关系型数据库,我们还是喜欢把它认定为一个NoSQL数据。


特点
TngouDB可以脱离Lucene单机的现在,通过网络可以把TngouDB部署在单独的服务器上,单独处理存储于查询业务。TngouDb同时简化的Solr的复杂性,用户可以通过简单的SQL语句进行相关的数据操作。TngouDB可以完全抛开Lucene与Solr相关的知识,用常见 的SQL语句就可以实现。

文档文档地址:http://www.tngou.net/doc/tndb 支持完整的安装、配置、使用文档。
使用案例现在TngouDB暂且是内部测试版本,请先不用用于上线的项目!我们会不断的开发与更新,后期会发布相应的正式版本。

现在TngouDB用于天狗网的搜索业务 天狗农搜(http://www.tngou.net/search

案例

    TngouDBHelp dbHelp = TngouDBHelp.getConnection();  //建立连接
    dbHelp.createTable("tngou");  //创建表
    dbHelp.dropTable("tngou");   //删除表
    dbHelp.closeConnection();   //回收连接 回收到连接池
    String sql="create table tg";
    dbHelp.execute(sql);              //执行SQL语句
    sql="drop table tg";
    dbHelp.execute(sql);
    dbHelp.closeConnection();   //回收连接 回收到连接池  
    dbHelp.close();            //关闭连接…… 一般情况下不需要关闭   ;

应用的SQL语句

INSERT INTO table_name(id:key,title:text,message:text,url) 
            VALUES ('1','TngouDB标题','内容……','www.tngou.net'),
                   ('2','TngouDB标题2','内容2……','www.tngou.net')
SELECT title,message,url FORM table_name1,table_name2,table_name3
  WHERE title= '查询条件' AND message='查询条件'  LIMIT 20
  • 项目目的:OSChina 实现全文搜索的简单封装框架 License: Public Domain 包含内容: 重建索引工具 -> IndexRebuilder.java 增量构建索引工具 -> IndexUpdater.java 全文搜索框架 http://git.oschina.net/oschina/search-framework TngouDB 背景 TngouDB是天狗网(tngou.

 相关资料
  • 搜索引擎分为两部分: 时间筛选 和 搜索引擎 (详情) 1.时间筛选 便捷按钮有今日、昨日、前日、上周 X、近七天,并且能自定义选择时间段来得出想要的结果报表 2.搜索引擎 (时间段详情) 选择日期,查看来自对应时间段内,各个搜索引擎的访问量比例

  • lucene 和 es 的前世今生 lucene 是最先进、功能最强大的搜索库。如果直接基于 lucene 开发,非常复杂,即便写一些简单的功能,也要写大量的 Java 代码,需要深入理解原理。 elasticsearch 基于 lucene,隐藏了 lucene 的复杂性,提供了简单易用的 restful api / Java api 接口(另外还有其他语言的 api 接口)。 分布式的文档存储

  • 搜索引擎 关键参数 报告 method metrics(指标, 数据单位) 其他参数 搜索引擎 source/engine/a pv_count (浏览量(PV)) pv_ratio (浏览量占比,%) visit_count (访问次数) visitor_count (访客数(UV)) new_visitor_count (新访客数) new_visitor_ratio (新访客比率,%) ip

  • 更改历史 * 2018-05-07 胡小根 初始化文档 1 历史、现状和发展 1.1 历史 1.2 现状 1.3 发展 难点:预测发展方向。 2 安装和使用 2.1 安装 2.2 使用 创建index和type 上传单条数据 批量上传数据 查询 2.3 示例 2.4 最佳实践 难点:最佳实践,超出于示例,应该归纳总结出积累的技巧。 3 同类技术对比 难点:归纳比对项 参考资料 El

  • 元搜索引擎 原搜索引擎是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。 自己没搜索引擎,又想要大规模的数据源,怎么办?可以对百度搜索和谷歌搜索善加利用,以小搏大,站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索和谷歌搜索来实现,比如网站的新闻采集,比如技术、品牌的新闻跟踪,比如知识库的收集,比如人机问答系

  • Elasty/Lucene真的需要在文档中存储所有索引数据吗?您是否可以通过它传递数据,以便Lucene可以将单词索引到它的哈希表中,并为每个文档提供一个单独的字段,该字段具有返回每个文档来自哪里的URL(或任何对您有意义的指针)?

  • 主要内容:搜索引擎组件,搜索引擎是如何工作的?搜索引擎是指一个庞大的互联网资源数据库,如网页,新闻组,程序,图像等。它有助于在万维网上定位信息。 用户可以通过以关键字或短语的形式将查询传递到搜索引擎中来搜索信息。 搜索引擎然后搜索其数据库并向用户返回相关链接。 比如下面常用到两个搜索引擎 - 百度 谷歌 搜索引擎组件 一般来说,搜索引擎有三个基本组件,如下所列 - Web爬虫 - Web爬虫也称为蜘蛛或机器人。 它是一个收集网络信息的软件组件

  • 我需要在工作区的所有项目的源目录中找到所有Java类型(类、接口、枚举、注释),名称为字符串。例如,输入“测试”将返回所有项目源目录中以“测试”开头的所有Java类型。我试图用JDT的搜索引擎处理这个问题,如下所示 上面的代码返回了一些不在Eclipse工作区中的java类型。例如: 找到:TestSimple(未打开)[在TestSimple.class[在 TestSimple.java是我的