目前的互联网已经迈入大数据时代,通过对海量的数据进行分析,能够产生极大的商业价值。如果我们需要大量数据,有哪些获取数据的方式呢?常用的方式主要有以下5种。查看全文>>
字符串是一种表示文本的数据类型,字符串中的字符可以是ASCII字符、各种符号以及各种Unicode字符。Python中的字符串有如下三种表现方式。第1种方式:使用单引号包含字符。示例代码如下:查看全文>>
前期采集到的数据,或多或少都存在一些瑕疵和不足,比如数据缺失、极端值、数据格式不统一等问题。因此,在分析数据之前需要对数据进行预处理,包括数据的清洗、合并、重塑与转换。Pandas中专门提供了用于数据预处理的很多函数与方法,用于替换异常数据、合并数据、重塑数据。查看全文>>
斐波那契数列(Fibonacci sequence),又称黄金分割数列、因数学家莱昂纳多·斐波那契(Leonardoda Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”。查看全文>>
MySQL属于关系型数据库,Mongodb属于非关系型数据库,两者有不同的特点,为什么选择Mongodb而非MySQL存储爬虫数据呢?本节课就对这一问题做详细解答。查看全文>>
Python中的模块可分为三类,分别是内置模块、第三方模块和自定义模块,相关介绍如下。查看全文>>