问题：

Java：使用异步编程优化应用程序

裴育

2023-03-14

所需代码如下：-

/* Scheduler */
private long triggerDetection(String startDate, String endDate) {
for (UrlRequest request : urlRequests) {
                if (!validateRequests.isWhitelisted(request)) {
                    ContentDetectionClient.detectContent(request);
                }
            }
}

/* Client */
public void detectContent(UrlRequest urlRequest){
        Client client = new Client();
        URI uri = buildUrl(); /* It returns the URL of this dropwizard application's resource method provided below */

        ClientResponse response = client.resource(uri)
                .type(MediaType.APPLICATION_JSON_TYPE)
                .post(ClientResponse.class, urlRequest);

        Integer status = response.getStatus();
        if (status >= 200 && status < 300) {
            log.info("Completed request for url: {}", urlRequest.getUrl());

        }else{
            log.error("request failed for url: {}", urlRequest.getUrl());
        }
    }

    private URI buildUrl() {
        return UriBuilder
                .fromPath(uriConfiguration.getUrl())
                .build();
    }

/* Resource Method */
 @POST
    @Path("/pageDetection")
    @Consumes(MediaType.APPLICATION_JSON)
    @Produces(MediaType.APPLICATION_JSON)
    /**
     * Receives the url of the publisher, crawls the content of that url, applies a detector to check if the content is malicious.
     * @returns returns the probability of the page being malicious
     * @throws throws exception if the crawl call failed
     **/
    public DetectionScore detectContent(UrlRequest urlRequest) throws Exception {

        return contentAnalysisOrchestrator.detectContentPage(urlRequest);
    }

/* Orchestrator */
public DetectionScore detectContentPage(UrlRequest urlRequest) {
        try {

            Pair<Integer, HtmlPage> response =  crawler.rawLoad(urlRequest.getUrl());
            String content =   response.getValue().text();

            DetectionScore detectionScore = detector.getProbability(urlRequest.getUrl(), content);
            contentDetectionResultDao.insert(urlRequest.getAffiliateId(), urlRequest.getUrl(),detectionScore.getProbability()*1000,
                    detectionScore.getRecommendation(), urlRequest.getRequestsPerUrl(), -1, urlRequest.getCreatedAt() );

            return detectionScore;

        } catch (IOException e) {
            log.info("Error while analyzing the url : {}", e);
            throw new WebApplicationException(e, Response.Status.INTERNAL_SERVER_ERROR);
        }
    }

我在考虑以下方法：-

不是通过POST调用dropwizard资源方法，而是直接从计划程序调用Orchestrator.DetectContent(urlRequest)。

谢了。

编辑：我能想到两个瓶颈：

网页下载
将结果插入数据库（数据库位于另一个系统中）
似乎一次执行1个URL的处理

$ free -m
             total       used       free     shared    buffers     cached
Mem:          7843       4496       3346          0        193       2339
-/+ buffers/cache:       1964       5879 
Swap:         1952        489       1463

top - 13:31:19 up 19 days, 15:39,  3 users,  load average: 0.00, 0.00, 0.00
Tasks: 215 total,   1 running, 214 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.5%us,  0.0%sy,  0.0%ni, 99.4%id,  0.1%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   8031412k total,  4605196k used,  3426216k free,   198040k buffers
Swap:  1999868k total,   501020k used,  1498848k free,  2395344k cached

共有1个答案

孔飞翔

2023-03-14

首先检查你大部分时间都在哪里。

我想大部分时间都浪费在下载URL上了。

如果下载URL花费了90%以上的时间，那么可能无法改进应用程序，因为瓶颈不是java而是网络。

Downloading --> Parsing --> Saving

注释后编辑

正如假设的那样，瓶颈不是cpu时间，所以对java代码进行干预并不重要。

如果您知道您每天下载多少千兆字节，就有可能看到它们是否接近您网络的最大带宽。

null

类似资料：

Java：使用异步编程优化应用程序

问题内容：我必须修改一个dropwizard应用程序以缩短其运行时间。基本上，此应用程序每天接收大约300万个URL，然后下载并解析它们以检测恶意内容。问题在于该应用程序只能处理100万个URL。当我查看该应用程序时，发现它正在进行许多顺序调用。我想对如何通过使其异步或其他技术来改进应用程序提出一些建议。所需代码如下：- 我在考虑以下方法：我直接通过调度程序调用，而不是通过POST调用dro
异步编程

介绍 Javascript 是一个单线程的编程语言，单线程的特点就是一次只能处理一件事情，当前代码任务耗时执行会阻塞后续代码的执行。异步编程则是一种事件驱动编程，请求调用函数或方法后，无需立即等待响应，可以继续执行其他任务，而之前任务响应返回后可以通过状态、通知和回调来通知调用者。异步编程方法 js 中的异步编程方法有回调函数、事件处理函数、观察者、Promise、Generator、async
异步编程

NodeJS最大的卖点——事件机制和异步IO，对开发者并不是透明的。开发者需要按异步方式编写代码才用得上这个卖点，而这一点也遭到了一些 NodeJS反对者的抨击。但不管怎样，异步编程确实是NodeJS最大的特点，没有掌握异步编程就不能说是真正学会了NodeJS。本章将介绍与异步编程相关的各种知识。回调在代码中，异步编程的直接体现就是回调。异步编程依托于回调来实现，但不能说使用了回调后程序就异
异步编程

目前为止，我们在做的都是同步编程。同步编程执行过程很简单：一个程序从第一行开始，逐行执行一直到末尾。每次调用一个函数时，程序就会等待这个函数返回然后在执行下一行。在异步编程中，函数地执行通常是非阻塞的。换句话说，每次你调用一个函数它就会立即返回，但相对得，这就表示函数并不会立即被执行。它有了一种机制（名为调度程序），让可以随时在未来执行这些函数。使用异步编程会导致程序在任何异步函数开始之前就
python异步编程使用yield from过程解析

本文向大家介绍python异步编程使用yield from过程解析，包括了python异步编程使用yield from过程解析的使用技巧和注意事项，需要的朋友参考一下前言 yield from 是 Python3.3 后新加的语言结构。yield from的主要功能是打开双向通道，把最外层的调用方法与最内层的子生成器连接起来。这两者就可以进行发送值和返回值了，yeild from结构的本质是
1.13 异步编程

JavaScript 的一个强大特性就是它可以轻松地处理异步编程。作为面向互联网设计的语言，JavaScript 从一开始就需要响应一些诸如点击和按键这些用户交互的能力。Node.js 通过使用回调函数来替代事件进一步推广了 JavaScript 的异步编程。随着越来越多的项目开始使用异步编程，事件和回调函数已不能满足开发者的所有需求。因此 Promise 应运而生。 Promise 是异步编程的

Java：使用异步编程优化应用程序

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档