|
|
使用pyppeteer淘宝登录,获取Cookies
现在淘宝的商品搜索页必须要登录才能见,所以必须要cookies才能进行下一步操作。本期介绍如何使用pyppeteer登录淘宝,获取Cookies。
pyppeteer介绍
地址:https://github.com/miyakogi/pyppeteer
介绍:Unofficial Python port of puppeteer JavaScript (headless) chrome/chromium browser automation library.非官方的chrome浏览器,前身是JavaScript的puppeteer
安装:python3 -m pip install pyppeteer
打开网站并截图
|
|
第一次运行时需要下载Chromium,你可以提前在终端输入pyppeteer-install
来下载。
登录淘宝
整体逻辑很简单:
- 设置pyppeteer启动项,打开一个浏览器
- 打开淘宝登录页面
- 修改浏览器属性
- 输入账号密码
- 滑动滑块
- 登录
代码太长,可以直接去Github上看,记得要加上自己的账号密码。记得要用小号,如果长时间使用一个账号,会出现各种各样的验证。
登录的主代码:
|
|
所有代码在AwesomeCrawler/taobao_login
如何建立Cookie池
必须多个账号,那么如何注册多个淘宝账号呢。。
- 可以通过第三方提供手机号验证码服务商,通过pyppeteer注册账号,保存账号信息
- 登录账号并保存在redis
- 开线程检查账号是否已过期,若过期重新登录即可