Python网络爬虫:老板,需要特殊服务吗?
ztj100 2024-11-27 23:33 19 浏览 0 评论
大家好,我是大爆炸。
网络爬虫,爬天爬地爬空气。
除了常规的下载文字、图片、音频这些,还能干啥?
还能干的有很多,比如一些「多种多样」的特殊服务。
2
特殊服务
特殊服务,就是那些定制化的 API。
API 的概念也很好理解:
比如你想爬一个网站的数据,你需要分析这个网站,要向哪个 url 发起请求,要向服务器传递哪些数据,拿到服务器的返回数据又要怎么解析出想要的数据。
其实,这个过程,就是在「抽象化」出一个 API。
例如,上篇文章的视频下载实战。
对于写好的「视频下载程序」而言,输入就是视频名,输出就是下载好的视频文件。
你可以把「视频下载程序」叫做一个 API,本质上就是一个完成特定任务的接口。
当然,这些所谓的 API,并非网站管理者提供给你的,而是你自己通过写程序实现的。
这些 API 是需要自己去挖掘,去发现,属于野生的,可以略带调侃地称呼它们为野生 API。
特殊服务,那可就了不得了。
它们不是野生的,而是网站官方提供的官方 API。
这些网站明码标价,提供着各式各样的定制化服务。
比如,这是「聚合数据」提供的一些查询类 API。
这些常规 API 今天不做讨论,咱们玩一些好玩的。
只会网络爬虫,也能玩转所谓的人工智能算法。
3
AI 开放平台
人工智能开放平台,很多家都有。
比较熟知的,腾讯、百度、京东、Face++ 都提供了 AI 开放平台。
腾讯 AI 开放平台:
https://ai.qq.com/
百度 AI 开放平台:
https://ai.baidu.com/
京东 AI 开放平台:
http://neuhub.jd.com/
旷视 AI 开放平台:
https://www.faceplusplus.com.cn/
常见的图像技术、语音技术、文字识别,这些网站都有提供。
单看服务数量,百度提供的接口最丰富。
单看图像技术,就眼花缭乱,这么多服务。
如果看服务质量,那应该各有千秋。比如旷视,人脸相关的技术,应该是比较好,毕竟早些年支付宝的人脸识别技术,都是旷视提供技术支持的,底子在那呢。
4
API 的使用方法
API 使用方法很简单,只要有爬虫基础,完全可以轻松应对。
咱们以旷视科技的人脸技术为例进行测试。
首先,创建一个账号。
然后,找一个想体验的服务,咱先试试美颜。这年头,没有美颜还真不敢上镜。
旷视科技提供了现成的功能体验。
美颜美型:
https://www.faceplusplus.com.cn/face-beautify/
分为美颜和美型,我的理解就是磨皮滤镜加瘦脸,看一下美颜效果。
左边是美颜前,右边是美颜后,拖拽中间的竖栏,可以调节查看。
下面有很多备选图片,你可以挨个翻牌子,看效果。都不喜欢,也可以点击自定义,上传自己想测试的图片。
这是通过 web 体验服务,如果想嵌入自己的程序里,那就需要学习如何使用这个 API 了。
登录账号,选择控制台,然后创建一个应用,选择「试用」类型。
填写一些信息后,就会生成一个 API Key 和 API Secret,这两个是使用 API 接口要用到的参数。
相当于你的个人账号和密码。
在控制台,有各种服务的使用说明,比如人脸美颜。
Beautify API v2:
https://console.faceplusplus.com.cn/documents/134252584
这个文档,有详细的接口描述,根据这些描述,就可以写代码。
可以看到请求 POST 请求,图片可以是以 URL、二进制文件或 base64 编码上传。
瞧,这就是我之前提到过的,POST 请求的内容,除了是一些文字内容,还可以是一张图片。
根据手册编写代码:
import requests
import base64
import json
import cv2
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
beautify_url = "https://api-cn.faceplusplus.com/facepp/v2/beautify"
# 你创建的应用的 API Key 和 API Secret(也叫 Secret Key)
AK = ''
SK = ''
# 可选参数,不填写,默认50
# 美白程度 0 - 100
whitening = 80
# 磨皮程度 0 - 100
smoothing = 80
# 瘦脸程度 0 - 100
thinface = 20
# 小脸程度 0 - 100
shrink_face = 50
# 大眼程度 0 - 100
enlarge_eye = 50
# 去眉毛程度 0 - 100
remove_eyebrow = 50
# 滤镜名称,不填写,默认无滤镜
filter_type = ''
# 二进制方式打开图片
img_name = 'test_1.png'
f = open(img_name, 'rb')
# 转 base64
img_base64 = base64.b64encode(f.read())
# 使用 whitening、smoothing、thinface 三个可选参数,其他用默认值
data = {
'api_key': AK,
'api_secret': SK,
'image_base64': img_base64,
'whitening': whitening,
'smoothing': smoothing,
'thinface': thinface,
}
r = requests.post(url=beautify_url, data=data)
html = json.loads(r.text)
# 解析base64图片
base64_data = html['result']
imgData = base64.b64decode(base64_data)
nparr = np.frombuffer(imgData, np.uint8)
img_res = cv2.imdecode(nparr, cv2.IMREAD_COLOR)
img_res_BGR = cv2.cvtColor(img_res, cv2.COLOR_RGB2BGR)
# 原始图片
img = cv2.imread(img_name)
img_BGR = cv2.cvtColor(img, cv2.COLOR_RGB2BGR)
# 显示图片
fig, axs = plt.subplots(nrows=1, ncols=2, sharex=False, sharey=False, figsize=(10,10))
axs[0].imshow(img_BGR)
axs[1].imshow(img_res_BGR)
plt.show()
你需要填写自己的 AK 和 SK,并下载一张图片。
图片地址:
https://cuijiahua.com/wp-content/uploads/2020/05/test_1.png
API 接口返回的数据是 base64 的二进制文件,需要解码,运行结果:
效果还不错吧!
除了美颜,还有很多服务,人脸检测、人脸识别、人脸关键点等等。
人脸关键点就是在脸上画一堆点,这有什么用?
一个比较成熟的例子就是虚拟主播。
看着还不错吧?
AI 开放平台提供了丰富的 AI 领域的基础能力,怎么用,用来干什么,就看自己的想象力了。
当然,这些免费使用的 API 接口有很多限制,比如不能请求太快等等。
想要 API 提供性能更好,QPS 更大的优质服务,那就得充钱了。
老板,加个钟!
相关推荐
- 人生苦短,我要在VSCode里面用Python
-
轻沉发自浅度寺量子位出品|公众号QbitAI在程序员圈子里,VisualStudioCode(以下简称VSCode)可以说是目前最火的代码编辑器之一了。它是微软出品的一款可扩展的轻量...
- 亲测可用:Pycharm2019.3专业版永久激活教程
-
概述随着2020年的到来,又有一批Pycharm的激活码到期了,各位同仁估计也是在到处搜索激活方案,在这里,笔者为大家收录了一个永久激活的方案,亲测可用,欢迎下载尝试:免责声明本项目只做个人学习研究之...
- Python新手入门很简单(python教程入门)
-
我之前学习python走过很多的歧途,自学永远都是瞎猫碰死耗子一样,毫无头绪。后来心里一直都有一个做头条知识分享的梦,希望自己能够帮助曾经类似自己的人,于是我来了,每天更新5篇Python文章,喜欢的...
- Pycharm的设置和基本使用(pycharm运行设置)
-
这篇文章,主要是针对刚开始学习python语言,不怎么会使用pycharm的童鞋们;我来带领大家详细了解下pycharm页面及常用的一些功能,让大家能通过此篇文章能快速的开始编写python代码。一...
- 依旧是25年最拔尖的PyTorch实用教程!堪比付费级内容!
-
我真的想知道作者到底咋把PyTorch教程整得这么牛的啊?明明在内容上已经足以成为付费教材了,但作者偏要免费开源给大家学习!...
- 手把手教你 在Pytorch框架上部署和测试关键点人脸检测项目DBFace
-
这期教向大家介绍仅仅1.3M的轻量级高精度的关键点人脸检测模型DBFace,并手把手教你如何在自己的电脑端进行部署和测试运行,运行时bug解决。01.前言前段时间DBFace人脸检测库横空出世,...
- 进入Python的世界02外篇-Pycharm配置Pyqt6
-
为什么这样配置,要开发带UI的python也只能这样了,安装过程如下:一安装工具打开终端:pipinstallPyQt6PyQt6-tools二打开设置并汉化点击plugin,安装汉化插件,...
- vs code如何配置使用Anaconda(vscode调用anaconda库)
-
上一篇文章中(Anaconda使用完全指南),我们能介绍了Anaconda的安装和使用,以及如何在pycharm中配置Anaconda。本篇,将继续介绍在vscode中配置conda...
- pycharm中conda解释器无法配置(pycharm配置anaconda解释器)
-
之前用的好好的pycharm正常配置解释器突然不能用了?可以显示有这个环境然后确认后可以conda正在配置解释器,但是进度条结束后还是不成功!!试过了pycharm重启,pycharm重装,anaco...
- Volta:跨平台开发者的福音,统一前端js工具链从未如此简单!
-
我们都知道现在已经进入了Rust时代,不仅很多终端常用的工具都被rust重写了,而且现在很多前端工具也开始被Rust接手了,这不,现在就出现了一款JS工具管理工具,有了它,你可以管理多版本的js工具,...
- 开发者的福音,ElectronEgg: 新一代桌面应用开发框架
-
今天给大家介绍一个开源项目electron-egg。如果你是一个JS的前端开发人员,以前面对这项任务桌面应用开发在时,可能会感到无从下手,甚至觉得这是一项困难的挑战。ElectronEgg的出现,它能...
- 超强经得起考验的低代码开发平台Frappe
-
#挑战30天在头条写日记#开始进行管理软件的开发来讲,如果从头做起不是不可以,但选择一款免费的且经得起时间考验的低代码开发平台是非常有必要的,将大幅提升代码的质量、加快开发的效率、以及提高程序的扩展性...
- 一文带你搞懂Vue3 底层源码(vue3核心源码解析)
-
作者:妹红大大转发链接:https://mp.weixin.qq.com/s/D_PRIMAD6i225Pn-a_lzPA前言vue3出来有一段时间了。今天正式开始记录一下梗vue3.0.0-be...
- 基于小程序 DSL(微信、支付宝)的,可扩展的多端研发框架
-
Mor(发音为/mr/,类似more),是饿了么开发的一款基于小程序DSL的,可扩展的多端研发框架,使用小程序原生DSL构建,使用者只需书写一套(微信或支付宝)小程序,就可以通过Mor...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 人生苦短,我要在VSCode里面用Python
- 亲测可用:Pycharm2019.3专业版永久激活教程
- Python新手入门很简单(python教程入门)
- Pycharm的设置和基本使用(pycharm运行设置)
- 依旧是25年最拔尖的PyTorch实用教程!堪比付费级内容!
- 手把手教你 在Pytorch框架上部署和测试关键点人脸检测项目DBFace
- 进入Python的世界02外篇-Pycharm配置Pyqt6
- vs code如何配置使用Anaconda(vscode调用anaconda库)
- pycharm中conda解释器无法配置(pycharm配置anaconda解释器)
- Volta:跨平台开发者的福音,统一前端js工具链从未如此简单!
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)