问题是,如果用户输入Instagram的URL,如何从Instagram个人资料中读取文本。我尝试使用java.net.URL,但得到的都是大量的HTML文本。我对网页工作知之甚少,所以我在寻求一些帮助,如何从个人资料(简历,帖子标题,评论)中获取文本。
谢谢!
您可以使用jSoup(https://jsoup.org/)从html内容中提取特定标签。
下面是一个从HTML主体中提取h1标签内容的例子。
// Parse HTML String using JSoup library
String HTMLSTring = "<!DOCTYPE html>"
+ "<html>"
+ "<head>"
+ "<title>JSoup Example</title>"
+ "</head>"
+ "<body>"
+ "<table><tr><td>
<h1>HelloWorld</h1></tr>"
+ "</table>"
+ "</body>"
+ "</html>";
Document html = Jsoup.parse(HTMLSTring);
String title = html.title();
String h1 = html.body().getElementsByTag("h1").text();
您可以从下面的博客文章中找到更多示例 https://javarevisited.blogspot.com/2014/09/how-to-parse-html-file-in-java-jsoup-example.html
希望这有帮助。
你好,你可以把html代码分割成html标签前后的字符串。
并将列表中的第二个字符串用于第一次拆分,将列表中的第一个字符串用于第二次拆分。
但是,您需要了解html的一些知识,才能知道html标记是什么,以及如何找到需要拆分的标记。
玩得开心,我希望我能帮助你!
你可以使用刮擦工具(Parsehub的刮擦等)。不过,请注意,这违反了Instagram的服务条款,所以要小心提示提示
个人资料 展示、管理个人的基本资料 点击编辑按钮,进入编辑模式,输入新的用户信息,点击保存,完成资料修改。
问题内容: 我正在使用和来处理注册和配置文件。我想在注册时为用户创建一个配置文件。我创建了一个自定义注册表格,并使用以下教程将其添加到urls.py: http://dewful.com/?p=70 本教程中的基本思想是覆盖默认注册表单以同时创建配置文件。 -在我的个人资料应用中 在中 显示该表格,我可以输入城市,但是它不会保存或在数据库中创建该条目。 问题答案: 你已经准备就绪,你已经成功构建了
问题内容: 在将其他字段(例如位置,性别,雇主等)添加到用户个人资料时,是否应该在其中添加其他列并将其保存在其中?还是应该创建一个新表来保存用户个人资料信息? 另外,当用户上传个人资料图片时,是否应该将其保存在同一张表中?(请注意,这不是生产服务器,我只是在本地运行服务器上执行此操作以弄清楚问题)。谢谢 问题答案: 你必须为用户个人资料建立模型: 然后在中配置
24.8 参考资料与延伸阅读 [1]通过在 /usr/src/kernels/linux-3.10.89 下面的 README 以及“ make help ”可以得到相当多的解释 核心编译的功能:可以用来测试 CPU 性能喔!因为 compile 非常耗系统资源! 2002/05/29:第一次完成 2003/02/11:重新编排与加入 FAQ 2004/06/11:原本的 2.4.xx 版本核心被
23.6 参考资料与延伸阅读 [1]维基百科对 X Window 的介绍:http://en.wikipedia.org/wiki/X_Window_System [2]X Server/X client 与网络相关性的参考图示: http://en.wikipedia.org/wiki/File:X_client_sever_example.svg [3]系统的 man page: man xi
22.7 参考资料与延伸阅读 [1]GNU Privacy Guard (GPG) 官方网站的介绍:http://www.gnupg.org/ RPM 包装文件管理程序:http://www.study-area.org/tips/rpm.htm 中文 RPM HOW-TO:http://www.linux.org.tw/CLDP/RPM-HOWTO.html RPM 的使用:http://lin