Python网络爬虫:从入门到精通
教材教辅研究生/本科/专科教材11.2万字
更新时间:2023-10-25 19:34:57 最新章节:参考文献
书籍简介
本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
吕云翔主编
- 会员本书结合了Python3.6的新特性,完全为零基础的初学者量身定做。书中例举大量实例,介绍了Python的基本语法、编码规范和一些编程思想。本书第1~8章为Python语言基础,主要介绍Python的基本用法;第9章为一个实战,帮助读者理解前8章的知识;第10~17章为Python的进阶使用,包含面向对象编程、函数式编程入门、文件读写、异常处理、模块和包几个部分;第18章为第2个实战,帮助读者融高教教材8.4万字
最新上架
- 会员本书系统地介绍了数字媒体技术的基础知识、应用与发展,以及数字媒体关键技术,主要内容包括数字媒体技术概述,数字图像与计算机视觉技术,数字音频技术,数字视频技术,计算机图形学与动画技术,数字媒体压缩、存储与传输技术,融媒体技术,人机交互技术,虚拟现实技术,数字出版与数字媒体资源管理。本书采用章节式写法,理论联系实际,讲解深入浅出,每章都设计丰富的知识栏目和课堂实训模块。本书可作为高等院校数字媒体、网络教材教辅14.4万字
- 会员本书主要包括农村电子商务发展的经济增长效应和家庭消费福利效应两部分内容。第一部分基于2000—2017年中国县级数据展开研究,研究发现电子商务发展显著促进了县域经济增长。第二部分将行政村网络代购点数量与家庭微观消费数据匹配,研究发现增加一个村级网络代购点,家庭人均网络消费平均提高41.23%,占家庭人均网络消费对数值均值的36.81%,表明网络代购点建设经济效应是显著的。本书的研究结果表明电子商务教材教辅7.3万字
- 会员本书以一种由浅入深、通俗易懂的方式阐述了创新创业的基本概念以及当前社会对创新创业的要求,并对软件相关领域的创业形式和创业机会进行了分析。书中针对大学生创新创业过程中的各类问题进行了探讨,系统地介绍了如何定义创新创业、如何组建项目团队、如何根据市场和国家政策选择和策划创业项目、如何进行实践中的团队管理和项目管理,并讲解了一些成功和失败的创业例子,还提供了关于创业技巧和创业流程的内容。本书既可以作为普教材教辅12.6万字
- 会员本书按照“分析现状—问题治理—提出政策建议”的顺序进行编写,首先阐述新媒体广告的概念、发展和主要问题;其次讨论大数据对新媒体广告传播的价值、新媒体广告的大数据应用,指出大数据应用中的问题,针对“大数据营销”“大数据杀熟”等现象展开深入剖析;最后提出增强新媒体广告的合理消费促进作用、增强新媒体广告优质内容供给、实现物质文明与精神文明协调发展的政策建议。本书适合新闻传播专业、市场营销专业、电子商务专业教材教辅14.8万字
- 会员如今的组织管理中,四个最基本的关系:个人与目标的关系、个人与组织的关系、组织与环境的关系以及组织与变化的关系,都完全改变了。随之而来的新范式必然也将逐渐融入组织行为学的经典框架,本教材不仅强调对基本概念和理论的准确把握,更突出对环境的分析,以及新环境影响下的组织行为、组织学习、组织网络的创新和价值。组织管理的核心价值,需要回归到组织赋能与激活人,以响应“现实”组织的特征。本教材不仅融入了大量实际案教材教辅38.3万字
同类书籍最近更新
- 会员本书主要讲解Hadoop的分布式文件系统、MapReduce编程模型和Spark大数据处理技术。全书共12章,具体包括大数据概述、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、HBase分布式数据库、Spark概述、基于Scala的Spark编程、Windows环境下Spark综合编程、SparkSQL结构化数据处理、SparkStreaming流计算、高教教材9.7万字