更新时间:2022-11-02 来源:黑马程序员 浏览量:
read_csv()函数的作用是将CSV文件的数据读取出来,并转换成DataFrame对象。read_csv()函数的语法格式如下。
read_csv(filepath_or_buffer,sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None ...)
上述函数中常用参数表示的含义如下:
(1)file_or_buffer:表示文件路径,可以为URL字符串。
(2)sep:指定使用的分隔符,如果不指定默认用“,”分隔。
(3)header:指定行数用来作为列名,如果读取的文件中没有列名,则默认为0,否则设置为None。
(4)names:用于结果的列名列表。如果文件不包含标题行,则应该将该参数设置为None。
(5)index_col:用作行索引的列编号或者列名,如果给定一个序列,则表示有多个行索引。
需要注意的是,在读取文件时,如果传入的是文件的路径,而不是文件名,则会出现报错,具体的解决方法是先切换到该文件的目录下,使用os模块获取该文件的文件名。
接下来,使用read_csv()函数将存储在E盘目录下“itcast.csv”文件的内容读取出来,示例代码如下。
In [81]: import pandas as pd file = open(r'E:\数据分析\itcast.csv') # 读取指定目录下的csv格式的文件 file_data=pd.read_csv(file) file_data Out[81]: one_name two_name 0 1 4 1 2 5 2 3 6
Text格式的文件也是比较常见的存储数据的方式,扩展名为“.txt”,它与上面提到的CSV文件都属于文本文件。如果希望读取Text文件,既可以用前面提到的read_csv()函数,也可以使用read_table()函数。