1.安装库
pip install pyquery
2.pyquery基本使用
2.1 导入库
from pyquery import PyQuery
# 加载html内容
p=PyQuery(html)
3. 元素查找
3.1 css选择器查找
a=p('a')
3.2 链式查找
a=p('li')('a')
3.3 后代选择器查找
a=p('li a')
3.4 类元素查找
a1=p1('.aaa a') # class="aaa"
a1=p1('#qq a') # id="qq"
3.5 attr,获取元素属性
href=p1('#qq a').attr('href') # 拿属性,默认获取第一个
3.6 获取元素文本
text=p1('#qq a').text() # 拿文本
3.7 获取元素所有属性
# 多个标签拿属性
its=p1('li a').items()
for it in its:
href=it.attr('href')
text=it.text()
print(href,text)
4. html元素修改
4.1 after(),在标签后面添加新标签
p('div.a').after('<div class="c">我</div>')
4.2 append(),在标签里面添加新标签
p('div.a').append("<span>我</span>")
4.3 修改属性
p('div.bbb').attr('class','aaa')
# 新增属性, 前提是该标签没有这个属性
p('div.ccc').attr('id','aaa')
4.4 删除属性
p('div.ccc').remove_attr('id')
4.5 删除标签
p('div.ccc').remove()