天天看點

python爬蟲提取a标簽_Python爬蟲 Pyppeteer擷取a标簽的文本和連結

# 擷取a标簽

title_elements = await page.Jx('//*[@class="result c-container "]/h3/a')

for item in title_elements:

# 擷取文本:方法一,通過getProperty方法擷取

title_str1 = await (await item.getProperty('textContent')).jsonValue()

print(title_str1)

# 擷取文本:方法二,通過evaluate方法擷取

title_str2 = await page.evaluate('item => item.textContent', item)

print(title_str2)

# 擷取連結:通過getProperty方法擷取

title_link = await (await item.getProperty('href')).jsonValue()

print(title_link)