我必须将HTML中的所有文本元素提取到Java字符串中。但是在单独的字符串中。
我有以下代码:
<div class="sb-spieldaten">
<p class="sb-datum hide-for-small">
<a href="/jumplist/spieltag/wettbewerb/C1/saison_id/2014/spieltag/2">2. Spieltag</a>
|
<a href="/aktuell/waspassiertheute/aktuell/new/datum/2014-07-26">Sa., 26.07.2014</a>
| 17:45 Uhr
</p>
<p class="sb-datum show-for-small">
<a href="/jumplist/spieltag/wettbewerb/C1/saison_id/2014/spieltag/2">2. Spieltag</a>
<br />
<a href="/aktuell/waspassiertheute/aktuell/new/datum/2014-07-26">26.07.2014</a>
<br>
17:45 Uhr
</p>
<div class="ergebnis-wrap">
<div class="sb-ergebnis">
<div class="sb-endstand">2:3
<div class="sb-halbzeit">(<span>2:</span>2)
</div>
</div>
</div>
</div>
<p class="sb-zusatzinfos">
<span class="hide-for-small">
<a href="/stadion/stadion/verein/504/saison_id/2014">Letzigrund</a>
|
<strong>4.200 Zuschauer</strong>
<br />
</span>
<strong>Schiedsrichter:</strong>
<br class="show-for-small" />
<a title="Fedayi San" href="/fedayi-san/profil/schiedsrichter/4791">Fedayi San</a>
</p>
</div>
我用:
Elements myText = doc.getElementsByClass("sb-spieldaten");
String myString = myText.select(a.sb-datum.hide-for-small").text();
但是与此同时,我提取了“ hide-for-small”类中的所有Strings。所以我得到的答案是:2. Spieltag |
sa。,26.07.2014 | 17:45 Uhr 2. Spieltag 26.07.2014 17:45 Uhr Letzigrund | 4200
Zuschauer Schiedsrichter:Fedayi San
如何仅获得其中一个字符串?我无法理解地使用.getElementsByClass(“ …”)找到它。有没有办法提取特定的“ a
href”元素?还是我必须使用.split()方法?
例如代码片段
Document abc = Jsoup.connect("http://www.abc.in/").timeout(0).get();
Elements ee = abc.select("a[href*=xyz]");// all hrefs containing xyz substring
String xyz = ee.first().attr("abs:href");
我正在使用java从BNN网站上简单地跟踪股票的变化,我已经将其全部设置为访问正确的值。然而,我得到的不是一个数值,而是。如何访问网站上显示的数值? 此外,如果你能帮我得到这个网站上的当前值,那也会很有帮助。 //编辑// 我更新了我的代码,但现在输出只有2,它只是从{{quoteObj.high|Number: 2}}中获取数字,我希望在网站上显示实际的数字值。 我已经附上了一个网页的图像和ht
问题内容: 我有两节课 在ABC班 我想在另一个课程中使用它,让我们说DEF课程 但是它说java.lang.NullPointerException,你知道吗?谢谢 这是我的ABC类的代码,我想在另一类> _ <中使用它们 问题答案: 您需要在内存中分配ABC,否则它指向,因此NullPointerException: 编辑 :好的,如果ABC没有像这样的零参数构造函数: 您有两种选择来解决您的
这里Book是根类,即最终的CSV将命名为books.CSV。 使用,我们只获得字段名title和author,但是我们还需要来自author类的字段名(name和age),有没有方法获得这些字段名?
我有一个关于这个html的问题: 我试图提取lorem ipsum约翰尼亚当斯在2005年6月1日00:99从它。但是我得到的是洛雷姆·艾普森·约翰尼·亚当斯。25评论。 请,我如何得到lorem ipsum约翰尼亚当斯在六月一日,2005 00:99从html? 这是我正在使用的代码 Jsoup演示链接:https://try.jsoup.org/~BAit4PmvqNcdVAKLBv4Yp4Q
问题内容: K,所以我有两个表: 我想从类别中获取所有信息,并计算每个类别中的问题数(question_id)。 假设,第一个类别(计费)将有一个问题,第二个类别(安全)将有3个问题。 我已经试过了: 问题答案: 您想这样做: 在将确保没有问题类别获得与数= 0上市
我想从html文本中删除第一个和最后一个div标签。我使用jSoup库来解析html文本。我尝试了一些在代码中显示的东西。有多个div标签的html文本,或者没有,但是我想删除第一个和最后一个div标签,如果有的话。