首页技术文章正文

Python大数据培训:通过read_csv()函数读取CSV文件的数据

更新时间:2022-11-02 来源:黑马程序员 浏览量:

IT培训班

  read_csv()函数的作用是将CSV文件的数据读取出来,并转换成DataFrame对象。read_csv()函数的语法格式如下。

read_csv(filepath_or_buffer,sep=',', delimiter=None,
         header='infer', names=None, index_col=None, usecols=None,
         squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None ...)

  上述函数中常用参数表示的含义如下:

  (1)file_or_buffer:表示文件路径,可以为URL字符串。

  (2)sep:指定使用的分隔符,如果不指定默认用“,”分隔。

  (3)header:指定行数用来作为列名,如果读取的文件中没有列名,则默认为0,否则设置为None。

  (4)names:用于结果的列名列表。如果文件不包含标题行,则应该将该参数设置为None。

  (5)index_col:用作行索引的列编号或者列名,如果给定一个序列,则表示有多个行索引。

  需要注意的是,在读取文件时,如果传入的是文件的路径,而不是文件名,则会出现报错,具体的解决方法是先切换到该文件的目录下,使用os模块获取该文件的文件名。

  接下来,使用read_csv()函数将存储在E盘目录下“itcast.csv”文件的内容读取出来,示例代码如下。

In [81]: import pandas as pd
         file = open(r'E:\数据分析\itcast.csv')
         # 读取指定目录下的csv格式的文件
         file_data=pd.read_csv(file)
         file_data
Out[81]:
            one_name  two_name
    0             1          4
    1             2          5
    2             3          6

  Text格式的文件也是比较常见的存储数据的方式,扩展名为“.txt”,它与上面提到的CSV文件都属于文本文件。如果希望读取Text文件,既可以用前面提到的read_csv()函数,也可以使用read_table()函数。

分享到:
在线咨询 我要报名
和我们在线交谈!