Pandas教程-Python Pandas 读取文件

从CSV文件读取

CSV代表逗号分隔值，它被定义为一种简单的文件格式，使用特定的结构排列表格数据。它以纯文本存储表格数据，如电子表格或数据库，并具有数据交换的通用格式。CSV文件打开到Excel文件中，行和列数据定义了标准格式。

将csv文件读入pandas DataFrame是快速而直观的。我们不需要编写多行代码来在pandas中打开、分析和读取csv文件。相反，我们可以在一行中执行这些操作，并将数据存储在DataFrame中。

要读取Pandas文件，首先我们必须从文件格式中加载数据到DataFrame中。您只需要一行代码即可将数据加载到代码中。

Name,Hire Date,Salary,Leaves Remaining  
John Idle,08/15/14,50000.00,10  
Smith Gilliam,04/07/15,65000.00,6  
Parker Chapman,02/21/14,45000.00,7  
Jones Palin,10/14/13,70000.00,3  
Terry Gilliam,07/22/14,48000.00,9  
Michael Palin,06/28/13,66000.00,8

df = pd.read_csv('a.csv')

代码

import pandas  
df = pandas.read_csv('hrdata.csv')  
print(df)

在上述示例中，只需要三行代码就足以读取文件，其中只有一行实际工作，即pandas.read_csv()。

输出：

        Name                   Hire Date      Salary            Leaves Remaining
0     John Idle                08/15/14       50000.0                    10
1     Smith Gilliam            04/07/15       65000.0                     8
2     Parker Chapman           02/21/14       45000.0                    10
3     Jones Palin              10/14/13       70000.0                     3
4     Terry Gilliam            07/22/14       48000.0                     7
5     Michael Palin            06/28/13       66000.0                     8

然而，pandas还在DataFrame中使用了基于零的整数索引；我们并没有告诉它我们的索引应该是什么。

从JSON读取

如果有任何JSON文件，Pandas可以通过一行代码轻松读取它。

df =pd.read_json('hrdata.json')

它允许通过嵌套来使用索引。

Pandas将列表的列表转换为DataFrame，并单独定义列名。JSON解析器负责将JSON文本转换为另一种表示，该表示必须接受根据JSON语法的所有文本。它还可以接受非JSON形式或扩展。

在读取之前，我们必须导入JSON文件。

import pandas as pd  
data = pd.read_json('hrdata.json')   
print(data)

输出：

        Name                   Hire Date        Salary            Leaves Remaining
0     John Idle                08/15/14         50000.0                     10
1     Smith Gilliam            06/01/15         65000.0                     6
2     Parker Chapman           05/12/14         45000.0                     7
3     Jones Palin              11/01/13         70000.0                     3    
4     Terry Gilliam            08/12/14         48000.0                     9
5     Michael Palin            05/23/13         66000.0                     8

从SQL数据库读取

要从SQL读取文件，首先需要使用Python库建立连接，然后将查询传递给pandas。在这里，我们使用SQLite进行演示。

首先，我们必须安装pysqlite3并在终端中运行以下命令：

pip install pysqlite3

sqlite3用于建立与数据库的连接，然后我们可以使用它通过SELECT查询生成DataFrame。

要建立与SQLite数据库文件的连接：

import sqlite3  
con = sqlite3.connect("database.db")

SQLite数据库中存在一个名为information的表，列名为"index"的列的索引。我们可以通过传递SELECT查询和con从information表中读取数据。

df = pd.read_sql_query("SELECT * FROM information", con)

输出：

Index         E_id         Designation              
0              46              M.Com
1              47              B.Com
2              48              B.Com

Pandas教程-Python Pandas 读取文件

从CSV文件读取

从JSON读取

从SQL数据库读取

推荐文章

其它