BS4与JSON的数据提取和处理方法
BS4(Beautiful Soup)和JSON(JavaScript Object Notation)是两种常用的数据提取和处理方法。
BS4的数据提取和处理方法
BS4是一种基于Python的HTML解析器,它可以帮助我们提取页面中的特定信息。它提供了一系列的方法来处理HTML文档,比如find(),find_all(),find_parents(),find_next_siblings()等方法。使用这些方法,我们可以轻松地提取页面中的特定信息。
# 使用BS4获取页面中所有链接
from bs4 import BeautifulSoup
html = '''
Link 1
Link 2
Link 3
'''
soup = BeautifulSoup(html, 'html.parser')
links = soup.find_all('a')
for link in links:
print(link['href'])
上面的代码可以提取页面中所有的链接,输出结果如下:
https://www.example.com/1
https://www.example.com/2
https://www.example.com/3
JSON的数据提取和处理方法
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它可以帮助我们提取页面中的特定信息。它提供了一系列的方法来处理JSON文档,比如loads(),dumps(),load(),dump()等方法。使用这些方法,我们可以轻松地提取页面中的特定信息。
# 使用JSON获取页面中的所有数据
import json
data = {
"name": "John Doe",
"age": 25,
"location": "New York"
}
data_string = json.dumps(data)
data_dict = json.loads(data_string)
print(data_dict["name"])
print(data_dict["age"])
print(data_dict["location"])
上面的代码可以提取页面中的所有数据,输出结果如下:
John Doe
25
New York
以上就是BS4和JSON的数据提取和处理方法。
千锋教育是高品质web前端培训机构,千锋教育拥有大量实力web前端培训讲师,提供优质的web培训课程,web前端培训,欢迎报名千锋教育。