1. 原始数据表
创建测试数据表 test.xlsx:
时间 | 项目经理 | 预算 | 设备数量 |
---|---|---|---|
2020-01-24 | 张三 | 2670 | 2 |
2019-12-27 | 李四 | 283.1 | 3 |
2019-12-27 | 王二 | 0 | 1 |
张三 | 25 | 4 |
2. 使用Pandas的read_excel()函数读取原始数据表中的数据
read_excel()函数可以直接读取excel文件并返回pandas的dataframe数组,index标签默认为行号,columns标签默认为excel表中的第一行,默认读取第一个sheet的数据,可以根据sheet名或者序号进行sheet的索引。
官方文档的参数说明请点击这里
1 | import pandas as pd |
3. 读取数据的数据类型
Dataframe 拥有属性dtypes可以查看column数据类型,整数对应int64,浮点数对应float64等
1 | print(df.dtypes) |
4. 时间的读取
根据读取的数据可以看到时间未对应到datetime数据类型,根据read_excel函数的官方文档,函数的参数:
parse_dates: bool, list-like, or dict, default False
可以将指定column设置为时间类型,本例使用list格式修改时间column为datetime格式
1 | df = pd.read_excel(io="test.xlsx", parse_dates=["时间"]) |