当前位置: 首页 > 知识库问答 >
问题:

从自己的个人资料中阅读文本

鲍健柏
2023-03-14

问题是,如果用户输入Instagram的URL,如何从Instagram个人资料中读取文本。我尝试使用java.net.URL,但得到的都是大量的HTML文本。我对网页工作知之甚少,所以我在寻求一些帮助,如何从个人资料(简历,帖子标题,评论)中获取文本。

谢谢!

共有3个答案

卫阳炎
2023-03-14

您可以使用jSoup(https://jsoup.org/)从html内容中提取特定标签。

下面是一个从HTML主体中提取h1标签内容的例子。

        // Parse HTML String using JSoup library
        String HTMLSTring = "<!DOCTYPE html>"
                + "<html>"
                + "<head>"
                + "<title>JSoup Example</title>"
                + "</head>"
                + "<body>"
                + "<table><tr><td>
                       <h1>HelloWorld</h1></tr>"
                + "</table>"
                + "</body>"
                + "</html>";
 
        Document html = Jsoup.parse(HTMLSTring);
        String title = html.title();
        String h1 = html.body().getElementsByTag("h1").text();

您可以从下面的博客文章中找到更多示例 https://javarevisited.blogspot.com/2014/09/how-to-parse-html-file-in-java-jsoup-example.html

希望这有帮助。

侯池暝
2023-03-14

你好,你可以把html代码分割成html标签前后的字符串。

并将列表中的第二个字符串用于第一次拆分,将列表中的第一个字符串用于第二次拆分。

但是,您需要了解html的一些知识,才能知道html标记是什么,以及如何找到需要拆分的标记。

玩得开心,我希望我能帮助你!

从景曜
2023-03-14

你可以使用刮擦工具(Parsehub的刮擦等)。不过,请注意,这违反了Instagram的服务条款,所以要小心提示提示

 类似资料:
  • 个人资料        展示、管理个人的基本资料 点击编辑按钮,进入编辑模式,输入新的用户信息,点击保存,完成资料修改。

  • 问题内容: 我正在使用和来处理注册和配置文件。我想在注册时为用户创建一个配置文件。我创建了一个自定义注册表格,并使用以下教程将其添加到urls.py: http://dewful.com/?p=70 本教程中的基本思想是覆盖默认注册表单以同时创建配置文件。 -在我的个人资料应用中 在中 显示该表格,我可以输入城市,但是它不会保存或在数据库中创建该条目。 问题答案: 你已经准备就绪,你已经成功构建了

  • 问题内容: 在将其他字段(例如位置,性别,雇主等)添加到用户个人资料时,是否应该在其中添加其他列并将其保存在其中?还是应该创建一个新表来保存用户个人资料信息? 另外,当用户上传个人资料图片时,是否应该将其保存在同一张表中?(请注意,这不是生产服务器,我只是在本地运行服务器上执行此操作以弄清楚问题)。谢谢 问题答案: 你必须为用户个人资料建立模型: 然后在中配置

  • 24.8 参考资料与延伸阅读 [1]通过在 /usr/src/kernels/linux-3.10.89 下面的 README 以及“ make help ”可以得到相当多的解释 核心编译的功能:可以用来测试 CPU 性能喔!因为 compile 非常耗系统资源! 2002/05/29:第一次完成 2003/02/11:重新编排与加入 FAQ 2004/06/11:原本的 2.4.xx 版本核心被

  • 23.6 参考资料与延伸阅读 [1]维基百科对 X Window 的介绍:http://en.wikipedia.org/wiki/X_Window_System [2]X Server/X client 与网络相关性的参考图示: http://en.wikipedia.org/wiki/File:X_client_sever_example.svg [3]系统的 man page: man xi

  • 22.7 参考资料与延伸阅读 [1]GNU Privacy Guard (GPG) 官方网站的介绍:http://www.gnupg.org/ RPM 包装文件管理程序:http://www.study-area.org/tips/rpm.htm 中文 RPM HOW-TO:http://www.linux.org.tw/CLDP/RPM-HOWTO.html RPM 的使用:http://lin