前期采集到的数据,或多或少都存在一些瑕疵和不足,比如数据缺失、极端值、数据格式不统一等问题。因此,在分析数据之前需要对数据进行预处理,包括数据的清洗、合并、重塑与转换。Pandas中专门提供了用于数据预处理的很多函数与方法,用于替换异常数据、合并数据、重塑数据。查看全文>>
斐波那契数列(Fibonacci sequence),又称黄金分割数列、因数学家莱昂纳多·斐波那契(Leonardoda Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”。查看全文>>
MySQL属于关系型数据库,Mongodb属于非关系型数据库,两者有不同的特点,为什么选择Mongodb而非MySQL存储爬虫数据呢?本节课就对这一问题做详细解答。查看全文>>
Python中的模块可分为三类,分别是内置模块、第三方模块和自定义模块,相关介绍如下。查看全文>>
Python程序中最常见的错误为语法错误。语法错误又称为解析错误,它是指开发人员编写了不符合Python语法格式的代码所引起的错误。含有语法错误的程序会抛出异常,无法运行。如下所示为一段包含语法问题的代码:查看全文>>
程序被执行后成为了一个活动的实体,这个实体就是进程。换言之,操作系统调度并执行程序,这个“执行中的程序”称为进程。进程是操作系统进行资源分配和调度的基本单位。一般情况下,进程占据的内存空间由控制块、程序段和数据段三个部分组成,各部分的介绍如下。查看全文>>