精通Scrapy网络爬虫在线阅读
会员

精通Scrapy网络爬虫

刘硕
开会员,本书免费读 >

计算机网络编程语言与程序设计5.8万字

更新时间:2020-11-28 14:59:54 最新章节:本书特点:

立即阅读
加书架
下载
听书

书籍简介

本书深入系统地介绍了Python流行框架Scrapy的相关技术及使用技巧。全书共14章,从逻辑上可分为基础篇和高级篇两部分,基础篇重点介绍Scrapy的核心元素,如spider、selector、item、link等;高级篇讲解爬虫的高级话题,如登录认证、文件下载、执行JavaScript、动态网页爬取、使用HTTP代理、分布式爬虫的编写等,并配合项目案例讲解,包括供练习使用的网站,以及京东、知乎、豆瓣、360爬虫案例等。本书案例丰富,注重实践,代码注释详尽,适合有一定Python语言基础,想学习编写复杂网络爬虫的读者使用。
品牌:清华大学
上架时间:2017-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

刘硕
主页

同类热门书

最新上架

  • 会员
    本书从网页开发的基础知识HTML5、CSS、JavaScript开始,以项目实战的方式介绍如何构建自适应网页,并通过工具免费发布自己的网站。在后面的章节中,以主流的3D框架ThreeJS为技术支撑,在网页中编写JavaScript代码,让读者构建完整的3D应用场景。
    少儿编程网编著计算机0字
  • 会员
    本书系统地讲述了HTML5、CSS3、JavaScript、Bootstrap等开发技术,满足Web前端开发基础学习的需求。本书包括了HTML5与CSS3的典型案例、使用Bootstrap框架开发、响应式布局等内容,适应Web前端开发从PC端转向移动端的变化。
    张大为 刘德山 崔晓松 张也非主编计算机14.3万字
  • 会员
    本书从Java初学者的角度出发,用通俗易懂的语言、贴近实际生活的实例,详细地介绍使用Java语言进行程序开发须掌握的知识和技术,帮助读者快速掌握Java程序开发的技能。全书共14章,分别为Java程序设计入门、Java语言基础、流程控制、方法与数组、面向对象基础、深入面向对象、常用类、异常、集合类、File与I/O流、多线程、图形用户界面、网络编程、反射。随书电子资源中还提供了综合项目实训,以巩固
    李西明 陈立为主编计算机17万字
  • 会员
    本书从初学者的角度出发,由浅入深地讲解了Java语言的相关内容。全书共11章,主要介绍了Java开发环境的搭建及其运行机制、基本语法、面向对象编程思想、多线程、常用API、集合、I/O、网络编程等内容,采用通俗易懂的语言阐述抽象的概念,选用生活中密切相关的例子演示知识的运用,通过剖析案例、分析代码含义、解决常见问题等方式进行讲解。书中还添加了许多阶段性任务来模拟程序开发过程,帮助初学者培养良好的编
    王静红 刘芳 李雅莉主编计算机10.6万字
  • 会员
    本书全面深入地介绍Elasticsearch的核心功能及其工作机制。本书由浅入深,从Elasticsearch的基本用法和架构原理,以及倒排索引、分片、节点角色和相关性等核心概念讲起;然后深入探讨数据处理和索引管理,涵盖映射模式、数据类型、文本分析、索引模板;接着详细介绍词项级搜索、全文搜索、复合查询和高级搜索等Elasticsearch的搜索功能,并深入讲解聚合;最后聚焦生产环境中的Elasti
    (英)马杜苏丹·孔达计算机27.5万字
  • 会员
    本书详细介绍C语言及其程序设计方法。全书共12章,主要内容包括:概述;数据类型、运算符及表达式;顺序结构程序设计;选择结构程序设计;循环结构程序设计;数组;指针;函数和变量的存储类型;结构体、公用体和枚举类型;编译预处理;位运算;文件。
    杨崇艳主编计算机13.7万字
  • 会员
    本书从初学者的角度出发,详细介绍了JavaWeb开发需要掌握的相关技术。全书分4个部分,共17章,由浅入深地介绍了HTTP、Tomcat、Servlet、Maven、数据库基础知识、JDBC、MyBatis、JSP、框架原理、如何设计自己的框架,以及在线购书商城、个人云文件系统、论坛、个人博客项目开发的完整过程。本书理论联系实际,不但能让读者全面掌握JavaWeb开发基本技术,而且能让读者开发
    李西明 陈立为 邵艳玲主编计算机8.5万字
  • 会员
    本书是网页特效设计任务驱动式教材。本书将网页特效分为9类,分别是基本网页特效、日期时间类网页特效、文字类网页特效、图片类网页特效、表单控件类网页特效、导航菜单类网页特效、选项卡类网页特效、内容展开与折叠类网页特效和页面类网页特效,同时相应地将全书分为9个教学单元,每个教学单元分析和设计一种类型的网页特效,将JavaScript和jQuery的相关知识合理地安排到各个教学单元中。
    陈承欢编著计算机7.4万字
  • 会员
    本书详细讲解JavaEE中Spring、SpringMVC和MyBatis三大框架(以下简称SSM)的基本知识和应用。本书在对知识点进行描述时采用了大量案例,以便读者理解SSM的核心技术。本书共15章,第1~5章主要讲解MyBatis的相关知识,包括初识MyBatis框架、MyBatis的核心配置、动态SQL、MyBatis的关联映射和缓存机制,以及MyBatis的注解开发;第6~9章主要讲解
    黑马程序员编著计算机15.8万字

同类书籍最近更新

  • 会员
    《Yii框架深度剖析》站在框架设计的高度,从源代码级别剖析了Yii框架的工作机制。《Yii框架深度剖析》分为15章,其内容涵盖了PHP框架的概念,Yii框架的工作流程,布局的概念及作用,模块的概念及作用,ActiveRecord模型的原理和作用,ActiveRecord模型的查询方法,小物件的概念及作用,小物件CActiveForm的作用以及调用方法,模型验证的概念及作用,Yii框架中的AJAX验
    刘琨程序设计10.3万字
  • 会员
    《触心:DT时代的大数据精准营销》从客户定位、社交、数据库构建、支付、社群、影视、二维码和物联网等角度来阐释企业面临的营销变局及应对策略。书中围绕互联网和大数据对营销的颠覆和重构,向企业展示出未来营销的方向和手段。企业只有抓住机遇,努力利用好大数据这一营销利器,抓住互联网+的时代机遇,才能在未来的发展中先人一步,实现精准营销的梦想。《触心:DT时代的大数据精准营销》案例详实,内容丰富,方法、策略指
    付峥嵘程序设计10.4万字
  • 会员
    本书基于主题划分章节,每一章归纳总结了对应的常见问题和解决方法。本书第1章是R基础知识,包括包安装和数据加载;第2章是绘图概述,帮助读者快速绘制基本图形;第3章至第6章具体介绍绘制几种不同图形(如条形图、折线图和散点图等)的方法;第7章至第12章讨论如何修改图形的各个元素(如注解、坐标轴、标题、图例和配色等);第13章介绍其他难以清晰分门别类的图形;第14章介绍将R绘制的图形以不同的格式导出的方法
    (美)温斯顿·常程序设计10.9万字
  • 会员
    这是一本全面、详细讲解WebRTC技术以及如何使用它构建一个可商用的视频会议系统的著作。技术维度,本书不仅详细讲解了WebRTC规范和全部API、信令系统、底层技术、移动端和服务端实现,而且还总结了作者多年来的“踩坑”经验;实战维度,本书不仅提供了可直接应用于视频会议和在线教育等场景的真实案例,而且开源了一个可商用的视频会议系统WiLearning,教读者如何从0到1搭建一个高并发、易扩展的视频会
    栗伟程序设计11.8万字
  • 会员
    《Scala程序员面试算法宝典》是一本讲解Scala程序员面试算法的书籍,在写法上,除了讲解如何解答算法问题外,还引入了实例辅以说明,让读者能够更好地理解本书内容。《Scala程序员面试算法宝典》将Scala程序员面试、笔试过程中各类算法类真题一网打尽。在题目的广度上,本书收集了近三年来几乎所有IT企业面试、笔试算法高频题目,所选择题目均为企业招聘使用题目。在题目的深度上,本书由浅入深,细致地分析
    猿媛之家组编程序设计11.3万字
  • 会员
    本书是C++程序设计的入门书籍,适合初学者使用。全书共11章,第1章主要介绍C++对C语言的扩充;第2~5章主要介绍C++的核心知识,包括类与对象、运算符重载、继承与派生、多态与虚函数;第6~7章主要介绍模板与STL;第8~9章主要介绍C++的I/O流和异常;第10章主要介绍C++11新特性;第11章带领读者开发一个综合项目——酒店管理系统,让读者将前面所学知识融会贯通,并了解实际项目的开发流程。
    黑马程序员编著程序设计11.8万字