目录

  1. 爬虫介绍、就业情况
  2. HTTP协议介绍
  3. Requests使用
  4. 解析器Xpath介绍
  5. MongoDB与MySQL
  6. 多线程爬虫
  7. Scrapy介绍
  8. Scrapy-redis介绍

介绍

第一章:数据采集概况

  1. 什么是数据采集
  2. 如何学习数据采集
  3. 数据采集前景讨论
  4. 爬虫工程师面试题

第二章:HTTP协议介绍

  1. HTTP协议(面试高频)
  2. HTTPS协议
  3. Cookie状态管理
  4. HTTP报文

第三章:Requests使用

  1. 基础用法
  2. 核心API
  3. 注意事项

第四章:Xpath介绍

  1. lxml使用
  2. scrapy的selector
  3. 注意事项

第五章:MongoDB与MySQL

  1. MongoDB使用
  2. MySQL使用
  3. 注意事项

第六章:多线程爬虫

  1. 线程、进程、协程(面试高频)
  2. 多线程爬虫
  3. 注意事项