腾讯视频首页轮播获取
起因
又想拾起来影视站写一下了。想用python写个影视后台,完成小程序+APP+WEB+PC软件的大统一。准备采取局部到主体的方式,先写点可能用到的小插件,先把写好了的一个小插件发一下,其实很简单,就是一个简单的网页分析。
不多说直接上代码
代码
x'''
Author: 晚空
Date: 2020-10-07
website:www.mmifx.com
Description: 一个简单的获取腾讯视频首页轮播图信息的小脚本
requirelibs: reqests、BeautifulSoup4、lxml、random(自带)
'''
import requests
from bs4 import BeautifulSoup
import random
headers = {
'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Mobile Safari/537.36',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
'Accept-Encoding': 'gzip, deflate',
'Accept-Language': 'zh-CN,zh;q=0.9'
}
url = "https://v.qq.com/"
html = requests.get(url, headers=headers)
html.encoding = "utf-8"
htmls = BeautifulSoup(html.text, "lxml")
divs = htmls.select(".slider_nav > a")
titles = htmls.select(".slider_nav > a > span > span")
results=[]
for i in range(0,9):
name=titles[i].get_text()
imgurl=divs[i+1].get("data-bgimage")
section={
"name":name,
"img":imgurl
}
results.append(section)
print(results)
效果
输出格式
xxxxxxxxxx
[
{'name': 'Beauty小姐', 'img': '//puui.qpic.cn/media_img/lena/PICll4t80_580_1680/0'},
{'name': '燕云台', 'img': '//puui.qpic.cn/media_img/lena/PICnpl1ra_580_1680/0'},
{'name': '隐秘而伟大', 'img': '//puui.qpic.cn/media_img/lena/PICbtcw79_580_1680/0'},
{'name': '花木兰', 'img': '//puui.qpic.cn/media_img/lena/PIC9v8c98_580_1680/0'},
{'name': '我们的歌2', 'img': '//puui.qpic.cn/media_img/lena/PICk3h2so_580_1680/0'},
{'name': '演员请就位2', 'img': '//puui.qpic.cn/media_img/lena/PICulgcfu_580_1680/0'},
{'name': '哈哈哈哈哈', 'img': '//puui.qpic.cn/media_img/lena/PICxsuamg_580_1680/0'},
{'name': '一点就到家', 'img': '//puui.qpic.cn/tv/0/1224751661_1680580/0'},
{'name': '当燃是少年', 'img': '//puui.qpic.cn/media_img/lena/PIC2gynco_580_1680/0'}]
配合服务器
用到的库
- requests
- BeautifulSoup4
- lxml
- random
最后
OK 就这样吧。有啥好玩的 我还会发出来的。图片实测可以本地服务器访问,爱奇艺和优酷 等两天再写。
作者:晚空,如若转载,请注明出处:《腾讯视频首页轮播获取》