Hadoop集群的部署方式方式分为三种,分别是独立模式(Standalone mode)、伪分布式模式(Pseudo-Distributed mode)、完全分布式模式(Cluster mode),具体介绍如下。查看全文>>
对于每一门编程语言,数组(Array)都是重要的数据结构之一,主要用来存储数据类型相同的元素。下面,针对Scala数组的定义与使用、数组遍历以及数组转换操作进行详细介绍。查看全文>>
URL是互联网上标准资源的地址,互联网上每个文件(即资源)都有一个唯一的URL,它包含了文件的位置以及浏览器处理方式等信息。URL地址由协议头、服务器地址、文件路径三部分组成。下面就来介绍下URL这三个组成部分。查看全文>>
maplotib是一个由约翰·亨特(John Hunter)等人员开发的、主要用于绘制2D图表的Python库,它支持numpy、pandas 的数据结构,具有丰富的绘制图表、定制图表元素(图例、注释文本、表格等)或样式(如颜色、字体、线型等)的功能,可以帮助开发人员轻松获得高质量的图表。此外,matplotib还可用于绘制一此3D图表。查看全文>>
网络爬虫,又称为网页蜘蛛、网络机器人,是一种按照一定的规则,自动请求万维网网站并提取网络数据的程序或脚本。爬虫具体能做些什么呢?接下来,我们通过一张图来总结网络爬虫的常用功能查看全文>>
在网络传输中HTTP协议非常重要,该协议规定了客户端和服务器端请求和应答的标准HTTP协议能保证计算机正确快速地传输超文本文档,并确定了传输文档中的哪部分,以及哪部分内容首先显示(如文本先于图形)等。查看全文>>