Pandas教程-Python Pandas 读取文件

从CSV文件读取
CSV代表逗号分隔值,它被定义为一种简单的文件格式,使用特定的结构排列表格数据。它以纯文本存储表格数据,如电子表格或数据库,并具有数据交换的通用格式。CSV文件打开到Excel文件中,行和列数据定义了标准格式。
将csv文件读入pandas DataFrame是快速而直观的。我们不需要编写多行代码来在pandas中打开、分析和读取csv文件。相反,我们可以在一行中执行这些操作,并将数据存储在DataFrame中。
要读取Pandas文件,首先我们必须从文件格式中加载数据到DataFrame中。您只需要一行代码即可将数据加载到代码中。
Name,Hire Date,Salary,Leaves Remaining
John Idle,08/15/14,50000.00,10
Smith Gilliam,04/07/15,65000.00,6
Parker Chapman,02/21/14,45000.00,7
Jones Palin,10/14/13,70000.00,3
Terry Gilliam,07/22/14,48000.00,9
Michael Palin,06/28/13,66000.00,8
df = pd.read_csv('a.csv')
代码
import pandas
df = pandas.read_csv('hrdata.csv')
print(df)
在上述示例中,只需要三行代码就足以读取文件,其中只有一行实际工作,即pandas.read_csv()。
输出:
Name Hire Date Salary Leaves Remaining
0 John Idle 08/15/14 50000.0 10
1 Smith Gilliam 04/07/15 65000.0 8
2 Parker Chapman 02/21/14 45000.0 10
3 Jones Palin 10/14/13 70000.0 3
4 Terry Gilliam 07/22/14 48000.0 7
5 Michael Palin 06/28/13 66000.0 8
然而,pandas还在DataFrame中使用了基于零的整数索引;我们并没有告诉它我们的索引应该是什么。
从JSON读取
如果有任何JSON文件,Pandas可以通过一行代码轻松读取它。
df =pd.read_json('hrdata.json')
它允许通过嵌套来使用索引。
Pandas将列表的列表转换为DataFrame,并单独定义列名。JSON解析器负责将JSON文本转换为另一种表示,该表示必须接受根据JSON语法的所有文本。它还可以接受非JSON形式或扩展。
在读取之前,我们必须导入JSON文件。
import pandas as pd
data = pd.read_json('hrdata.json')
print(data)
输出:
Name Hire Date Salary Leaves Remaining
0 John Idle 08/15/14 50000.0 10
1 Smith Gilliam 06/01/15 65000.0 6
2 Parker Chapman 05/12/14 45000.0 7
3 Jones Palin 11/01/13 70000.0 3
4 Terry Gilliam 08/12/14 48000.0 9
5 Michael Palin 05/23/13 66000.0 8
从SQL数据库读取
要从SQL读取文件,首先需要使用Python库建立连接,然后将查询传递给pandas。在这里,我们使用SQLite进行演示。
首先,我们必须安装pysqlite3并在终端中运行以下命令:
pip install pysqlite3
sqlite3用于建立与数据库的连接,然后我们可以使用它通过SELECT查询生成DataFrame。
要建立与SQLite数据库文件的连接:
import sqlite3
con = sqlite3.connect("database.db")
SQLite数据库中存在一个名为information的表,列名为"index"的列的索引。我们可以通过传递SELECT查询和con从information表中读取数据。
df = pd.read_sql_query("SELECT * FROM information", con)
输出:
Index E_id Designation
0 46 M.Com
1 47 B.Com
2 48 B.Com