我正在尝试使用jSoup刮一个网站,有以下内容。我对jSoup很陌生,还在想办法。我想做的是能够采取的产品名称和价格,并把他们放入一个excel文件的名称在A列和价格在B列,0.00可以忽略或放在C列,无论什么更容易。任何帮助都将是伟大的,因为我知道有人会问,这不是一个家庭作业。
谢谢提前,我真的很感激。
<tr>
<td class="sku" width="40" align="center">AAN13097</td>
<td class="productName" width="440"><a name="<!-- Empty field [Field4] -->"></a>
American Antler Dog Chew Large (40-60 lb Dogs) </td>
<!--<td id="weight_816">0</td>-->
<td class="quantity" width="20" align="center">
<input type="text" name="816:qnty" id="qnty_816" class="inputQuantity">
<input type="checkbox" name="itemnum" value="816" id="itemnum_816" class="itemnum">
</td>
<!--<td class="extWeight" id="extWeight_816">0.0</td>-->
<td width="80" align="center" id="price_816">$9.70</td>
<td width="120" align="center" class="extPrice" id="extPrice_816">$0.00</td>
</tr>
<!-- rec 815 -->
<tr>
<td class="sku" width="40" align="center">AAN13096</td>
<td class="productName" width="440"><a name="<!-- Empty field [Field4] -->"></a>
American Antler Dog Chew Medium (20-40 lb Dogs) </td>
<!--<td id="weight_815">0</td>-->
<td class="quantity" width="20" align="center">
<input type="text" name="815:qnty" id="qnty_815" class="inputQuantity">
<input type="checkbox" name="itemnum" value="815" id="itemnum_815" class="itemnum">
</td>
<!--<td class="extWeight" id="extWeight_815">0.0</td>-->
<td width="80" align="center" id="price_815">$7.15</td>
<td width="120" align="center" class="extPrice" id="extPrice_815">$0.00</td>
</tr>
**这是否是表元素,因为这是列表前的“表”代码,如果不是,我应该在html代码中查找什么?
<table border="0" cellpadding="8" cellspacing="0" id="orderForm" width="700">
<thead>
<tr>
<th width="40px" align="center">Line</th>
<th width="420" align="center">Item description </th>
<th width="40px" align="center">Quantity</th>
<th width="80px" align="center">Unit Price</th>
<th width="120px" align="center">Amount</th>
</tr>
</table><div class="tableCont"><table border="0" cellpadding="8" cellspacing="0"
id="orderForm" width="700" height="350px">
<tbody>
<!-- rec 1638 -->
<a name="1638"></a>
这个应该能行。然而,您发布的HTML中没有包含tr的表parent,当然,这段代码必须在HTML中才能运行,否则Jsoup将删除tr/td元素,代码将无法运行。
Document doc = Jsoup.parse(html); // html attribute should contain tr elements HTML content
String productName = doc.select("tr .productName").first().text(); // Get name
Element extPriceElement = doc.select("tr td.extPrice").first();
String id = extPriceElement.id().replaceAll("extPrice_", ""); // Get id
String productPrice = doc.select("tr #price_" + id).first().text(); // Get price
String productExtPrice = extPriceElement.text(); // Get ext price
System.out.println("Product name : " + productName);
System.out.println("Price : " + productPrice);
System.out.println("Ext price : " + productExtPrice);
问题内容: 使用Jsoup登录网站需要什么?我相信我的代码是正确的,但是我从未使用Jsoup成功登录到网站,因此我可能会丢失一些东西。这是我的代码: 返回一个显示未成功登录的登录页面。有一个名为的输入值,我认为这可能是为什么它不起作用的原因。这个值会随着时间的推移而上升。我运行了两次代码,时间变量返回了和。我的代码需要大约10秒钟的时间来打印文档,因此,变量在发送发布请求时是否已经更改?我不确定这
问题内容: 在此网站上,您可以输入您的学生卡号,然后显示该卡上还剩多少钱。我想使用JSOUP获得信息。这是我当前的代码,但是不起作用, 我没有太多经验,所以我不知道在哪里寻找问题。一些想法: 我应该使用还是? 在使用chrome devoloper工具时,发布数据是我使用功能发送的所有数据。但是,如果发送时出现错误,为什么? 我应该发送解密或加密的数据吗?(两者均在chrome devoloper
我正在尝试使用jsoup登录一个网站,我很确定我正在解析所有需要解析的东西,我只是不知道出了什么问题。 我用这个做参考:http://cs.harding.edu/fmccown/android/Logging-into-Pipeline.pdf 以下是我的AsycntTask doInBackground中的代码: 但问题是,当我登录时,它不包含页面的文档,它包含一个错误页面的文档,该页面只显示
我试图登录使用领英J汤,我已经尝试了几种方法,但总是遇到错误403,我哪里出错了? 测试一 错误控制台 组织。jsoup。HttpStatusException:获取URL时发生HTTP错误。状态=403,URL=https://www.linkedin.com在org。jsoup。帮手HttpConnection$响应。在org上执行(HttpConnection.java:590)。jsoup
我的问题是关于从特定网站上收集数据的可能性。目前,我的算法正在将HTML转换为文本,然后检查文件中包含的标记词,并求和标记的数量。 我的问题在于在刮网站的同时无法向下“滚动”。正如你所看到的,它正在检查一个twitter帐户上的标志数,但它仅限于50sh最新的tweets。我希望我说清楚了。 附注:我给了twitter一个例子,我不是在为twitter寻找特定的东西,而是更健壮的东西。 我将非常感
问题内容: 我已经广泛阅读了有关此操作的信息,并尝试了许多不同的版本,但无法使其正常工作。 基本上,我只想登录ConEdison网站并抓取我的帐单记录。这是我所拥有的: 我知道该信息是正确的(尽管我不知道是否真的需要传递没有值的数据参数)。 我没有任何错误,只是打印了登录页面(https://apps.coned.com/cemyaccount/NonMemberPages/Login.aspx?