用Python爬高值美女(爬虫+人脸检测+人脸检测)

用python爬高值美女(爬虫+人脸检测+人脸检测)
1个数据源
智虎主题“美”下所有问题的答案图片
2抓取工具
python 3,并使用第三方库requests、lxml、aipface,总共有100多行代码
3必要的环境
苹果电脑/linux/视窗系统(linux还没有经过测试,理论上是可能的。在窗户之前,许多反应都是不正常的。检查后,窗口限制本地文件名中的字最好看的穿越小说符,并使用常规过滤)
无需登录智虎(即无需提供智虎账户密码)
人脸检测服务需要一个百度云账户(即百度网盘/贴吧账户)
4人脸检测库
百度云人工智能开放平台提供的aipface是一个用于人脸检测的python软件开发工具包。它可以通过超文本传输协议直接访问并免费使用。
5测试过滤器条件
过滤所有不露面的图片(如风景图片、不露面的身体照片等)。(
过滤所有非女性(在抓取过程中,发现智虎的男性图片基本上都是明星,所以不考虑;在有些情况下,全印度妇女行动计划的性别识别不准确)
过滤所有不真实的字符,如卡通人物(人工智能人类置信度小于0.6)
过滤所有具有较低面值分数的图片(aipface美丽属性小于45,以节省存储空间空;同样,aipface分数没有客观性)
6实现逻辑
通过请求发起超文本传输协议请求,获取“美丽”下的讨论列表
通过lxml分析每个讨论中捕获的html,并获得其中所有img标签的相应src属性
通过请求发起一个请求,并下载src属性指向图片(不考虑动画)
通过aipface请求图片上的人脸检测
判断是否检测到人脸,使用“4个检测过滤条件”进行过滤
将过末世之黑暗召唤师最新章节滤后的图片保存到本地文件系统,文件名为颜值+作者+问题名+序列号
回到第一步,继续
7获取结果
直接储存在文件夹里(angelababy的力量离开了这个国家)。此外,88分是除婴儿以外的最高分。个人反对这个排名,他们的妻子不是最高分
密码
9操作准备
安装python 3,下载python
安装请求,lxml,百度-aip库,所有这些都可以通过pip,一个命令行安装
免费申请百度云检测服务。人脸识别——百度人工智能
我们的python学习按钮②群:⑧ ⑧ ⑧-④零⑧-⑧ ⑨ ③
成长离不开与优秀同龄人的交流。如果你需要一个好的学习环境和好的学习资源,欢迎你与大家分享互联网人才的需求,如何从零开始学好python,以及要学什么。
文章来源:www.atolchina.com