网络数据采集技术:Java网络爬虫实战在线阅读
会员

网络数据采集技术:Java网络爬虫实战

钱洋等
开会员,本书免费读 >

计算机网络编程语言与程序设计6.1万字

更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结

立即阅读
加书架
下载
听书

书籍简介

本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

钱洋等
主页

最新上架

  • 会员
    虽然技术在进步,硬件也越来越物美价廉,但如今软件工程师仍需要关注程序的性能优化。本书将介绍软件效率问题、Go语言快速入门知识、如何实现高效编程,告诉大家如何高效进行性能优化,以及何时进行,并给出需要的工具和相关知识,让你使用较少的资源实现高效编程。
    (波兰)巴特洛米·普洛特卡计算机27.3万字
  • 会员
    本书根据小学生学习的特点,选取了100多个有趣且易于理解的例子来介绍程序设计的基本概念,让小学生体会到用程序解决实际问题的乐趣。
    蔡驰聪计算机7.3万字
  • 会员
    本书从分布式系统的基础概念讲起,随后介绍分布式系统中间件SpringCloudAlibaba进阶实战,重点介绍了使用SpringCloudAlibaba框架整合各种分布式组件的完整过程。
    高洪岩编著计算机3.1万字
  • 会员
    本书全面介绍了华为在开源领域的实践和思考。首先,在认识开源部分,深入介绍了开源的起源、发展历程和底层逻辑;其次,在拥抱开源部分,揭示了华为积极参与和贡献开源的方式;然后,在践行开源部分,详细展示了华为在开源领域的具体实践和贡献;最后,在开源心法部分,深入探讨了华为对开源理念、价值观的理解和思考。此外,本书还剖析了开源产业、生态及文化的未来走向。本书旨在提供一个全面、深入的视角,让读者了解华为在开源
    任旭东等计算机16.7万字
  • 会员
    本书采用“任务驱动”的编写模式,由浅入深、循序渐进、系统地介绍了JavaWeb开发的相关知识。通过实际应用的案例,帮助读者巩固所学知识,以便更好地进行开发实践。全书共15章,内容涵盖了JavaWeb开发基础知识、Servlet接收GET请求数据、Servlet接收POST请求数据、Servlet生成HTTP响应数据、异步请求和异步响应、会话控制技术:Cookie与Session、过滤器Filt
    孔祥盛 赵芳主编计算机16.7万字
  • 会员
    本书共11章,第1章讲解Python基础,第2章讲解数据处理与分析,第3章讲解科研绘图与学术图表绘制库,第4章讲解绘制单变量图形,第5章讲解绘制双变量图形,第6章讲解绘制多变量图形,第7章讲解绘制其他2D图形,第8章讲解绘制3D图形,第9章讲解地理信息可视化,第10章讲解数据学术报告、论文和出版,第11章讲解实战训练营。
    关东升编著计算机9万字
  • 会员
    本书从零开始,介绍了Python编程语言的基础知识。全书共17章,第1-9章介绍了Python的语言基础;第10-13章介绍了与Python编程相关的拓展知识;第14-16章介绍了3个实战项目;第17章介绍了初学者如何利用当下最热门的AI工具ChatGPT学习Python编程。
    袁昕 贾炜编著计算机8.8万字
  • 会员
    本书是与主教材《C语言程序设计》配套的实验与训练参考书,同时也是一本可以独立于主教材的实验练习与实训提高的实践教材。全书分为四部分。第一部分是与主教材内容对应的基础知识与习题练习,第二部分是上机实践与实验指导,第三部分是综合实训与技能提高,第四部分是计算机等级考试介绍。
    孟东霞主编计算机7.1万字
  • 会员
    本书内容分为差分进化算法(以下简称算法)的设计及应用。本书从差分进化算法基本原理、单目标差分进化算法、面向约束优化的差分进化算法、面向多目标差分进化算法、面向离散问题的差分进化算法等五个方面进行了介绍。对提出的10个算法进行了详细介绍和讨论,并给给出了实验(仿真)结果。
    董明刚 王宁 艾兵等计算机9.6万字