171页,3420张小姐姐尽藏于我150G的马克思主义文件夹!

印象Python

共 997字,需浏览 2分钟

 · 2020-12-06

点击上方蓝字关注我们


今天我们来爬取彼岸图网的美女小姐姐。

首先我们的思路如下:


1.查看单张图片的链接。
2.获取网站图片总页数。
3.获取单页图片的全部连接。
4.实现下载


1.打开网站进入4k美女主页。

http://pic.netbian.com/4kmeinv/


2.首先F12快捷键定位图片位置,找到图片相关信息。


3.我们获取到的图片链接如下,加上我们网站主页。就是完整的图片链接了。


4.拼接起来的图片链接如下,也就是完整的图片地址:http://pic.netbian.com/uploads/allimg/190902/152344-1567409024af8c.jpg


5.可以看到图片总页数是171页。接下来我们用代码来实现网站总页数的获取


6.首先我们找到我们要获取图片的网站链接如下:


7.再加上我们的防爬三件套如下:


8.通过以下代码就可以获取到图片网站的总页数啦。


9.接下来我们要获取的是这171页图片网址的url。
分析网站可知,每一页地址的区别在于后面的index_?.html
http://pic.netbian.com/4kmeinv/index_1.htmlhttp://pic.netbian.com/4kmeinv/index_2.htmlhttp://pic.netbian.com/4kmeinv/index_3.html

10.接下来我们来用如下方式来构造这个链接。可以看到我们已经成功获取到所有网页的链接。


11.接下来我们要获取的是单页中每一张图片的链接地址。我们用xpath来解析这个图片链接。

如上图我们得到了该页面全部图片的链接。

12.分析完了接下问题就简单了,下载图片!


13.图片下载效果如下:


至此从分析到下载到最后数据保存已经全部完成。很简单的一个小例子。
需要源码学习的小伙伴们扫以下二维码


扫描二维码

获取更多精彩

印象python


回复‘小姐姐’即可!

Python很慢?Python之父一句话亮了
Python100经典练习题.pdf(附答案)
我去!微信竟然可以查出行轨迹了,预计又一波情侣要分手?

点个在看你最好看

浏览 44
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报