当前位置: 首页 > 知识库问答 >
问题:

Jsoup多个连接-使用已解析的URL元素

曹旭
2023-03-14

这是我的口袋碎片。爪哇:

package gimbi.edu.ba;

import java.util.ArrayList;
import java.util.HashMap;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import android.app.Fragment;
import android.content.Context;
import android.net.ConnectivityManager;
import android.net.NetworkInfo;
import android.os.AsyncTask;
import android.os.Bundle;
import android.app.ProgressDialog;
import android.os.Handler;
import android.support.v4.widget.SwipeRefreshLayout;
import android.view.LayoutInflater;
import android.view.View;
import android.view.ViewGroup;
import android.widget.ListView;

import com.nhaarman.listviewanimations.appearance.AnimationAdapter;
import com.nhaarman.listviewanimations.appearance.simple.SwingBottomInAnimationAdapter;
import com.nispok.snackbar.Snackbar;
import com.software.shell.fab.ActionButton;

public class PocetnaFragment extends Fragment {

    ListView listview;
    ListViewAdapter adapter;
    ProgressDialog mProgressDialog;
    ArrayList<HashMap<String, String>> arraylist;
    static String SEKCIJA = "sekcija";
    static String NASLOV = "naslov";
    static String LINK = "link";
    static String SLIKA = "slika";
    // URL Address
    String url = "http://gimnazijabihac.edu.ba";

    private SwipeRefreshLayout swipeView;


    @Override
    public View onCreateView(LayoutInflater inflater, ViewGroup container,
                             Bundle savedInstanceState) {

        // Inflate the layout for this fragment

        View view = inflater.inflate(R.layout.fragment_pocetna, container, false);

        listview = (ListView) view.findViewById(R.id.pocetna_listview);
        ActionButton actionButton = (ActionButton) view.findViewById(R.id.action_button);

        actionButton.setOnClickListener(new View.OnClickListener() {
            public void onClick(View v) {
                if(!isNetworkAvailable(getActivity())) {
                    Snackbar.with(getActivity()) // context
                            .text("Neuspjela konekcija.") // text to display
                            .duration(Snackbar.SnackbarDuration.LENGTH_LONG) // make it shorter
                            .show(getActivity()); // activity where it is displayed
                } else {
                new JsoupListView().execute();
                }
            }
        });

        swipeView = (SwipeRefreshLayout) view.findViewById(R.id.pocetna_swipe);
        swipeView.setColorScheme(android.R.color.holo_blue_dark, android.R.color.holo_blue_light, android.R.color.holo_green_light, android.R.color.holo_green_light);
        swipeView.setOnRefreshListener(new SwipeRefreshLayout.OnRefreshListener() {
            @Override
            public void onRefresh() {
                swipeView.setRefreshing(true);
                (new Handler()).postDelayed(new Runnable() {
                    @Override
                    public void run() {
                        new JsoupListView().execute();
                        swipeView.setRefreshing(false);
                    }
                }, 500);
            }
        });

        if(!isNetworkAvailable(getActivity())) {
            Snackbar.with(getActivity()) // context
                    .text("Neuspjela konekcija.") // text to display
                    .duration(Snackbar.SnackbarDuration.LENGTH_LONG) // make it shorter
                    .show(getActivity()); // activity where it is displayed
        }

            new JsoupListView().execute();

        return view;
    }

    public boolean isNetworkAvailable(Context context) {

        ConnectivityManager cm = (ConnectivityManager) context.getSystemService(Context.CONNECTIVITY_SERVICE);
        NetworkInfo netinfo = cm.getActiveNetworkInfo();

        if (netinfo != null && netinfo.isConnectedOrConnecting()) {
            android.net.NetworkInfo wifi = cm.getNetworkInfo(ConnectivityManager.TYPE_WIFI);
            android.net.NetworkInfo mobile = cm.getNetworkInfo(ConnectivityManager.TYPE_MOBILE);

            if((mobile != null && mobile.isConnectedOrConnecting()) || (wifi != null && wifi.isConnectedOrConnecting())) return true;
            else return false;
        } else
            return false;
    }

    // Title AsyncTask
    private class JsoupListView extends AsyncTask<Void, Void, Void> {

        @Override
        protected void onPreExecute() {
            super.onPreExecute();
            mProgressDialog = new ProgressDialog(getActivity(), ProgressDialog.THEME_HOLO_LIGHT);
            mProgressDialog.setMessage("Učitavanje..");
            mProgressDialog.setIndeterminate(false);
            mProgressDialog.show();
        }

        @Override
        protected Void doInBackground(Void... params) {
            arraylist = new ArrayList<HashMap<String, String>>();
            Elements aEles = null;
            Elements divRightPostEles = null;
            String rightNaslov = null;
            Document doc = null;

            try {
                doc = Jsoup.connect(url).get();

                /** Get A tag that is under DIV with classname right_naslov **/
                aEles = doc.select("div.right_naslov > a");
                if (aEles != null && aEles.size() > 0) {
                    if (aEles.size() == 2)
                        rightNaslov = aEles.get(1).ownText();
                    else
                        rightNaslov = aEles.first().ownText();
                }

                /**
                 * Since you say there are multiple DIV with right_post as
                 * classname, we will get all those right post elements and loop
                 * them one by one to retrieve its inner elements
                 **/
                divRightPostEles = doc.select("div.right_post");

                for (Element rightPostDiv : divRightPostEles) {
                    /** Each loop of this represents a right_post DIV element **/

                    HashMap<String, String> map = new HashMap<String, String>();

                    /**
                     * Get Font tag with [classname=nadnaslov] under
                     * span[classname=right_post_nadnaslov] under
                     * div[lassname=right_post]
                     **/
                    /** Try to get Font[classname=naslov] with the following method **/
                    Elements fontNadnaslov = rightPostDiv
                            .select("span.right_post_nadnaslov > font.nadnaslov");

                    /**
                     * Get A tag that is under div[classname=right_post_tekst] under
                     * div[classname=right_post]
                     **/
                    Element aRightPostTekst = rightPostDiv.select(
                            "div.right_post_tekst > a[href]").first();

                    // Retrive Jsoup Elements
                    if (fontNadnaslov != null && fontNadnaslov.size() > 0) {
                        map.put("naslov", fontNadnaslov.first().ownText());

                        if (aRightPostTekst != null) {
                            map.put("link", aRightPostTekst.attr("href"));

                            Element img = aRightPostTekst.select("img[src]").first();

                            if (img != null)
                                map.put("slika", "http://gimnazijabihac.edu.ba/" + img.attr("src"));
                        }

                        if (rightNaslov != null)
                            map.put("sekcija", rightNaslov);
                        // Set all extracted Jsoup Elements into the array
                        arraylist.add(map);
                    }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
            return null;
        }

        @Override
        protected void onPostExecute(Void result) {
            // Pass the results into ListViewAdapter.java
            adapter = new ListViewAdapter(getActivity(), arraylist);
            AnimationAdapter animationAdapter = new SwingBottomInAnimationAdapter(adapter);
            animationAdapter.setAbsListView(listview);
            // Set the adapter to the ListView
            listview.setAdapter(animationAdapter);
            // Close the progressdialog
            mProgressDialog.dismiss();
        }
    }

}

通常,我在异步任务中使用jsoup解析一些数据。现在,我需要解析另一个应该包含元素或w/e的url,例如aRightPostTekst。attr(“href”)

我可以在同一个异步任务中完成它,还是应该创建一个新的异步任务?

基本上我需要我的url是:

”http://url.com/“aRightPostTekst.attr(“href”)

然后我应该解析一些其他元素,放入数组列表,然后使用它。

是否可能,像多个连接和使用一个元素的url?

我正在解析以下网站:http://gimnazijabihac.edu.ba/,我正在解析异步任务中的href标记,比如:/e-novine/n/?id=340,那么完整的url是:http://gimnazijabihac.edu.ba/e-novine/n/?id=340

我应该从那个特定的网站解析html。

提前谢谢。


共有2个答案

鲁乐
2023-03-14

您可以解析两个URL,但必须分别为每个URL创建连接,并为每个不同的URL创建文档并进行相应的解析。

李文轩
2023-03-14
匿名用户

您需要分别解析每个URL,但应该能够在一个线程中完成(我不是Android开发者,所以我假设AsyncTask与thread类似)。

也不是

"http://url.com/" + aRightPostTekst.attr("href") 

你可以用

aRightPostTekst.attr("abs:href")

获取具有绝对路径(超文本传输协议://server/上下文/href)而不是相对路径的href

 类似资料:
  • 我以前问过另一个问题,可以在Jsoup解析HTML问题上看到。我试图解析一个数据值从一个网站到我的android应用程序。我现在意识到,虽然在我的应用程序中,我给出了网页的url和我需要的数据,但当我从我的应用程序连接到url时,它总是连接到网站的登录页面,因此找不到要解析的数据。我在想有没有办法避免这种情况?

  • 在我的应用程序中,目前我直接使用jdbc连接字符串连接到hive,如下所示- jdbc:hive2://control-node-host:10000/default;principal=hive/_host@xxx?hadoop.security.credential.provider.path=jceks:/hdfs@path_to_jceks_file 现在,我不是直接连接到配置单元,而是将

  • 我试图从这个表中解析数据。例如,假设我想解析第二行中的第二个元素(称为SLO)。 我可以看到TR里面有一个TR,而SLO这个词甚至没有ID或任何东西。我如何解析这个? 这是代码: 我不知道在文档中放什么。选择(“”);因为我从未解析过这样的东西。我只解析过网页标题之类的东西。有人能帮我吗?

  • 这是我试图解析的html: 我想得到

  • 我正在尝试解析引导程序的引导页生成的url。看起来像https://example.com/#page-2但是JSOUP不能解析它并显示主url。如何从Bootpage获取普通链接,或者如何使JSOUP解析它。 解析代码:

  • Jsoup库未解析给定URL的完整html。URL的原始html中缺少一些分区。 有趣的事情:http://facebook.com/search.php?init=s:email&q=somebody@gmail.com&type=users 如果您在jsoup的官方站点http://try.jsoup.org/中给出了上面提到的url,它通过提取正确地显示了url的确切html,但是在使用js