问题：

openNLP分类内容始终返回第一个类别

双弘益

2023-03-14

我正在测试openNLP库以实现分类内容的自动化，但我有麻烦。我正在使用此代码，它总是返回我训练数据中的第一个类别，我正在从任何新闻网站传递完整的文章。

    public void trainModel() {
        try {
            InputStreamFactory inputStreamFactory = new MarkableFileInputStreamFactory( new File("C:\\Users\\emehm\\Desktop\\data\\training_data.txt") );
            ObjectStream<String> lineStream = new PlainTextByLineStream(inputStreamFactory, "UTF-8");
            ObjectStream<DocumentSample> sampleStream = new DocumentSampleStream(lineStream);

            DoccatModel model = DocumentCategorizerME.train("en", sampleStream, TrainingParameters.defaultParams(), new DoccatFactory());
            DocumentCategorizerME myCategorizer = new DocumentCategorizerME(model);
            double[] outcomes = myCategorizer.categorize(  new String[]{ this.getFileContent() });
            String category = myCategorizer.getBestCategory(outcomes);
            Map<String, Double> map = myCategorizer.scoreMap(new String[]{ this.getFileContent() });
            System.out.println(category);
        } catch (IOException e) {
            // Failed to read or parse training data, training failed
            e.printStackTrace();
        }
    }

    public String getFileContent() throws IOException {
        InputStream is = new FileInputStream("C:\\Users\\emehm\\Desktop\\data\\statija.txt");
        BufferedReader buf = new BufferedReader(new InputStreamReader(is));
        String line = buf.readLine();
        StringBuilder sb = new StringBuilder();
        while (line != null) {
            sb.append(line).append("\n");
            line = buf.readLine();
        }
        buf.close();
        return sb.toString();
    }

培训数据：http://pastebin.com/ZhxswkvJ

我正在使用的文章：http://pastebin.com/xtABGcbh

它总是返回列表中的第一个类别，我想知道我缺少了什么？当我调试它时，它会返回所有的0.25分，并出于某种原因选择第一个。当我测试一个单词时，我想它是有效的，但它不适用于一篇文章。

共有1个答案

谭曦

2023-03-14

输入需要分成几个单词（按空格分开）。

更改此：Double[]的结果=myCategorizer.categorize（new String[]{this.getFileContent() });

双[]结果=myCategorizer.categorize（this.getFileContent（）(" ") );

之后，你应该有更好的结果。重要的是要注意有效性与模型的质量有关。

类似资料：

JENA:endpoint返回的内容类型：text/html

当我尝试向某个endpoint发送sparql查询时，例如：我明白了这不是唯一一个我无法向其发送查询的endpoint，我应该怎么做才能在其他内容类型中获得结果？我试着用谷歌搜索它，但我发现如果我将查询发送到错误的html（不是sparqlendpoint），就会发生这种情况，但是http://data.open.ac.uk/sparql是一个好的endpoint，我通过python向它发送
Nginx返回不正确的内容类型

我有一个Vue.js应用程序，我的部署设置非常标准，豆荚- 这是相关代码， Dockerfile： Nginx。形态： Ingress Prod：（为了简洁起见，仅保留必要的位），本地入口：我得到的错误是，未捕获的语法错误：意外令牌未捕获的语法错误：意外令牌网络选项卡中这两种资源的内容类型都是。编辑1：这是部署后我的文件夹的外观，我的js文件的路径是，
MediaPlayer.create（）始终返回null

问题内容：我以前使用过媒体播放器，但从未遇到过此问题。每当我尝试使用MediaPlayer.create（）时，该方法都会使我为null，并且无法播放声音。有什么我想念的吗？我的sound.mp3在我的原始文件夹中，通过将声音拖到eclipse中的文件夹中，我将其放置在其中。请帮忙，因为我以前玩过声音，所以这真的困扰我:( 问题答案：如果create（） API由于某种原因失败，则返回nul
NSClassFromString（）始终返回nil

问题内容：尽管是有效的类，但以下代码会打印。文档说方法返回由 aClassName 命名的类对象，或者如果当前没有加载该名称的类。如果 aClassName 为，则返回。我也试图获得当前的viewcontroller已加载但仍然得到可能是什么问题？更新：即使尝试这样做，我仍然可以问题答案：该函数确实适用于（纯和Objective-C派生的）swift类，但是仅当您使用全限定名
Re.match（）始终不返回

问题内容：我觉得有点愚蠢，但它不起作用：我有如果给定的用户是unicode。如果字符串中包含或，我想打印成功，但是我总是得到的结果。问题答案：隐式锚定到字符串的开头。如果要在字符串中搜索可以在字符串中任何位置的子字符串，则需要使用：输出：另外，Python Regexes不需要在开头和结尾都有一个。最后，我添加到该行的末尾，因为我认为这就是您想要的。否则，您会得到类似的信息，但并不太
hasRole始终返回403

我的安全配置似乎不正确。无论我在使用hasRole时做什么，我的endpoint总是返回403。此外，除非我在这两个和。很明显，我遗漏了一些东西。基本上，我希望所有内容都需要身份验证，但只有当用户是某些组的成员时（现在只需要admin），少数endpoint才可以访问。我的安全配置如下。旁边的一切都有效。我的AuthenticationConfiguration如下我的Authoriza

openNLP分类内容始终返回第一个类别

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档