参考文献
首先自打3.2版本之后,就开始支持中文索引了,支持的所有的语言参考这里:
https://docs.mongodb.com/manual/reference/text-search-languages/
然后,对于要支持索引的表需要建议text index,如何建立参考这里:
https://docs.mongodb.com/manual/core/index-text/
在建好索引text之后,如果检索参考:
https://docs.mongodb.com/manual/reference/operator/query/text/
实例
我有一个表,定义如下:
var ArticleSchema = new Schema({ created: { type: Date, default: Date.now }, title: { type: String, default: '', trim: true, required: 'Title cannot be blank' }, abstract: { type: String, default: '', trim: true }, abstractImg: { type: String, default: 'http://www.doocr.com/modules/core/client/img/brand/font-ocr.png', trim: true }, content: { type: String, default: '', trim: true }, category: { type: String, default: 'news', trim: true }, user: { type: Schema.ObjectId, ref: 'User' }, toPublish: { type: Boolean, default: true }, comments: [CommentSchema] });
然后,里面有数据的,所以我直接检索,得到结果:
> db.articles.find( { $text: { $search: "coffee" } } ) Error: error: { "waitedMS" : NumberLong(0), "ok" : 0, "errmsg" : "text index required for $text query", "code" : 27 }
说明没有建议text索引,那么建一个:
db.articles.createIndex( {title: "text", content: "text" })
看看效果:
> db.articles.createIndex( ... { ... title: "text", ... content: "text" ... } ... )
下面是结果,成功了
{ "createdCollectionAutomatically" : false, "numIndexesBefore" : 1, "numIndexesAfter" : 2, "ok" : 1 }
然后我开始检索:
> db.articles.find( { $text: { $search: "coffee" } } )
什么都没有。
我检索一个存在的中文:
> db.articles.find( { $text: { $search: "操作" } } ) { "_id" : ObjectId("58b0eb5a136dc51b541eaf81"), "user" : ObjectId("589c8d22f7d9dc15989be255"), "comments" : [ ], "toPublish" : true, "category" : "blog", "content" : "<p> </p><p><br/></p><p>其实就是使用ubuntu 16的安装方式,参考网址:</p><p><a href=\"https://docs.mongodb.com/master/tutorial/install-mongodb-on-ubuntu/\" target=\"_blank\">https://docs.mongodb.com/master/tutorial/install-mongodb-on-ubuntu/</a></p><p><br/></p><p>我的操作步骤:</p><pre>1.倒入key:sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv EA312927 </pre><p><br/></p><p>2. 创建mongodb的软件源:</p><p>/etc/apt/sources.list.d/mongodb-org-3.2.list</p><p>操作:</p><pre>echo "deb http://repo.mongodb.org/apt/ubuntu xenial/mongodb-org/3.2 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-3.2.list </pre><p><br/></p><p>3. 更新系统:</p><p>sudo apt update</p><p>之后查看所有可以更新的软件:</p><p>sudo apt list --upgradable</p><p>然后升级所有软件:</p><p>sudo apt upgrade</p><p><br/></p><p>4. 安装mongodb :</p><p>sudo apt install -y mongodb-org</p><p>也可以指定版本安装:</p><p>sudo apt-get install -y mongodb-org=3.2.8 mongodb-org-server=3.2.8 mongodb-org-shell=3.2.8 mongodb-org-mongos=3.2.8 mongodb-org-tools=3.2.8</p><p>不过我不使用这种方式。</p><p><br/></p><p>5. 添加systemd 自启动条目:</p><p>sudo vim /lib/systemd/system/mongod.service</p><p>添加内容:</p><p>[Unit]</p><p>Description=High-performance, schema-free document-oriented database</p><p>After=network.target</p><p>Documentation=https://docs.mongodb.org/manual</p><p><br/></p><p>[Service]</p><p>User=mongodb</p><p>Group=mongodb</p><p>ExecStart=/usr/bin/mongod --quiet --config /etc/mongod.conf</p><p><br/></p><p>[Install]</p><p>WantedBy=multi-user.target</p><p><br/></p><h2>6. 使能和启动服务:</h2><p>sudo systemctl enable mongod.service</p><p>sudo systemctl start mongod.service</p><p><br/></p><h2>查看状态,一切ok。</h2><p>sudo systemctl status mongod.service</p><p>● mongod.service - High-performance, schema-free document-oriented database</p><p>Loaded: loaded (/lib/systemd/system/mongod.service; enabled; vendor preset: enabled)</p><p>Active: active (running) since Sun 2016-07-31 21:59:00 CST; 13min ago</p><p>Docs: https://docs.mongodb.org/manual</p><p>Main PID: 19374 (mongod)</p><p>CGroup: /system.slice/mongod.service</p><p>└─19374 /usr/bin/mongod --quiet --config /etc/mongod.conf</p><p><br/></p><p>Jul 31 21:59:00 mint systemd[1]: Started High-performance, schema-free document-oriented database.</p><p><br/></p><p>7. 查看服务启动端口是否ok:</p><p>azuo1228@mint ~/webproj/mjs2/meanjs $ netstat -apn | grep mong</p><p>(Not all processes could be identified, non-owned process info</p><p>will not be shown, you would have to be root to see it all.)</p><p>unix 2 [ ACC ] STREAM LISTENING 76731 - /tmp/mongodb-27017.sock</p><p><br/></p><p><br/></p>", "abstractImg" : "http://www.doocr.com/modules/core/client/img/brand/font-ocr.png", "abstract" : "其实就是使用ubuntu 16的安装方式,参考网址:", "title" : "其实就是使用ubuntu 16的安装方式,参考网址:", "created" : ISODate("2017-02-25T02:26:34.483Z"), "__v" : 0 } >
最后
但是这种检索都是不完美的,如果需要更好的支持,就需要参考:
https://docs.mongodb.com/manual/tutorial/text-search-with-rlp/
安装rlp支持mongodb检索中文,但是不是免费的。。。
所以,最好的方式就是使用Elastic Search同步mongodb,然后通过它检索,超出本文范围了,以后再说。
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对小牛知识库的支持。
null 其中是结果(由打印)。 在列表中有重复的单词是合法的: 我生成的代码可以工作,前提是答案开头的单词以前没有出现过。在这里的第二个示例中,我的代码将失败,因为已经出现在答案从索引16开始的地方。 null 下面是我的代码(应该是可编译的): 我可以通过取消注释循环来解决我的问题,并使其通过第二个示例。然而,这会对性能产生严重影响。当我们输入100个单词、每个10个字符和1000000个字符
问题内容: 我想在给定的输入string中找到某个子字符串最后一次出现的位置(或索引)。 例如,假设输入字符串为,子字符串为,则应输出3。 我怎样才能做到这一点? 问题答案: 用途: 另外,请勿将其用作变量名,否则将使内置的阴影变暗。
本节要介绍一些字符串处理的标准库函数。这里介绍的技术适用于开发文本编辑器、字处理器、桌面排版软件、计算机化打字系统和其他文本处理软件。我们这里使用基于指针的字符串,本书稍后还将介绍把字符串作为成熟的对象。 5.12.1 字符与字符串基础 字符是 C++ 编程语言的基本组件。每个程序都是由一系列字符用有意义的方式组合而成的,计算机将其解释为一系列指令,用来完成一组任务。程序可能包含字符常量(char
问题内容: 我有: 功能: 和一个字符串:, 我本质上是想输入并返回,但是我却不断地返回。 码: 不知道怎么了! 问题答案: 理想情况下,您会 像痴呆的刺猬说的那样 使用 str.find 或 str.index 。但是你说你不能… 您的问题是您的代码仅搜索搜索字符串的第一个字符(第一个字符在索引2)。 您基本上是说if是in ,递增直到我测试它返回3时,但这仍然是错误的。这是一种方法。 它产生了
我对RegEx-es和类似的搜索模式非常缺乏经验,而且我所尝试的每一种方法都不能正常工作(大多数情况下会导致)。 找到字符串中最后一组数字开始的索引的可靠而简单的方法是什么?