2022-05-01发表Python1 分钟读完 (大约185个字)

Python批量爬取Wallhaven壁纸到本地

安装依赖包

# requests
pip install requests
# bs4
pip install beautifulsoup4

代码

import requests
from bs4 import BeautifulSoup

"""
wallhaven.cc
"""
def requestWallHaven(page, root_dir):
    """
    壁纸数据爬取
    :param page: 页数
    :param root_dir: 图片存放地址
    :return:
    """
    res = requests.get("https://wallhaven.cc/hot?page=" + page).text
    soup = BeautifulSoup(res, "html.parser")
    for item in soup.find_all("a", "preview"):
        print("页面地址: %s" % item.get("href"))
        body = requests.get(item.get("href")).text
        body_soup = BeautifulSoup(body, "html.parser")
        img_url = body_soup.find("img", id="wallpaper").get("src")
        print("图片地址: %s" % img_url)
        data = img_url.split("/")
        file_name = data[len(data) - 1]
        print("文件名称: %s " % file_name)
        with open(root_dir + file_name, "wb") as f:
            f.write(requests.get(img_url).content)
    print("Page => %s  Success！" % page)


if __name__ == '__main__':
    # Current-Page 32
    for i in range(32, 130):
        requestWallHaven(str(i), "E:\\Wallhaven\\")
    print("全部下载完毕！")