我一直在阅读有关文本分类的文章,并找到了几种可用于分类的Java工具,但我仍然想知道:文本分类与句子分类一样!
有没有专门针对句子分类的工具?
“文本分类”和“句子分类”之间没有形式上的区别。毕竟,句子是一种文本。但是总的来说,当人们谈论文本分类时,恕我直言,他们指的是更大的文本单元,例如文章,评论或演讲。将政治人物的讲话归类为民主人士或共和党人比对推文进行分类要容易得多。当每个实例中有很多文本时,您无需为每个训练实例压缩所有可以提供给您的信息,并且只需一句话就可以将其转化为朴素贝叶斯模型。
基本上,如果您将现成的weka分类器放在大量的句子中,则可能无法获得所需的性能数字。您可能必须使用POS标签,语法分析树,单词顺序,ngram等来扩充句子中的数据。还要获取任何相关的元数据,例如创建时间,创建位置,句子作者的属性等。显然,所有这些都取决于您到底要尝试什么分类..可以为您工作的功能必须直观地解决当前的问题。
subCategories标签 版本5.0.170927 新增 标签名 作用 包含属性 subCategories 获取指定分类下的子分类 categoryId ,item 标签属性: | 标签属性名 | 含义 | | --- | --- | | categoryId | 父级分类 id| | item | 循环变量,默认 vo | 代码演示 <portal:subCategories categ
sp_get_child_terms($term_id) 功能: 返回指定分类下的子分类 参数: $term_id:分类id 返回: 类型数组,指定分类下的子分类 示例: <?php $term_id=1; $terms=sp_get_child_terms($term_id ); //获取子分类信息 print_r($terms); //打印出子分类信息 ?> 返回数组item说明:
X2.2.0新增 sp_get_all_child_terms($term_id) 功能: 指定分类下的所有子分类 参数: $term_id: 分类id 返回: 类型array,指定分类下的所有子分类 使用: $terms = sp_get_all_child_terms(1);
前面的章节重点关注词:如何识别它们,分析它们的结构,分配给他们词汇类别,以及获得它们的含义。我们还看到了如何识别词序列或n-grams中的模式。然而,这些方法只触碰到支配句子的复杂约束的表面。我们需要一种方法处理自然语言中显著的歧义。我们还需要能够应对这样一个事实,句子有无限的可能,而我们只能写有限的程序来分析其结构和发现它们的含义。 本章的目的是要回答下列问题: 我们如何使用形式化语法来描述无限
问题内容: 我有以下SQL查询: 它在phpMyAdmin中工作正常。但那里有一个警告说: “此类型的子句先前已解析(在select附近)”。 你能猜出是什么问题吗?该查询可以执行并返回预期结果。 问题答案: 这似乎是phpMyAdmin分析器错误,请参阅github上的问题,查询本身有效。
我们已经看到利用计算机的能力来处理大规模文本是多么有用。现在我们已经有了分析器和基于特征的语法,我们能否做一些类似分析句子的意思这样有用的事情?本章的目的是要回答下列问题: 我们如何能表示自然语言的意思,使计算机能够处理这些表示? 我们怎样才能将意思表示与无限的句子集合关联? 我们怎样才能使用程序来连接句子的意思表示到知识的存储? 一路上,我们将学习一些逻辑语义领域的形式化技术,看看如何用它们来查