2026寒假学习Pyhon_3_day

1
2
3

# 查看pandas的版本
import pandas as pd
print(pd.__version__)

import pandas as pd
df = pd.read_excel(r"C:\Users\58760\Documents\Python Study\Pandas基础.xlsx", 
                   engine='openpyxl')
df
# df['销售额（元）']=df['销量']*df['单价（元）']

	工号	姓名	年龄	入职时间	销量	单价（元）
0	20090001	苏离	39	39850	5	4157
1	20090002	屈录	35	39812	14	2105
2	20090003	于帝还	30	39795	11	5032
3	20090004	潘雨类	36	39898	10	1774
4	20090005	周财站	37	39709	15	4377
5	20090006	郎临路	39	39813	7	4178
6	20090007	周沉忙	29	39888	11	1486
7	20090008	柳烟	29	39715	5	5014
8	20090009	[未填写]	25	39884	11	3386
9	20090010	傅师交	35	39821	13	1820
10	20090011	谢际	29	39792	10	1327
11	20090012	凤轻词	43	39729	6	3625
12	20090013	萧冷	28	39779	10	2642
13	20090014	邹己	29	39886	5	2549
14	20090015	窦顺太	35	39698	6	2482
15	20090016	喻塞晴	31	39757	12	2915
16	20090017	梁佛	28	39815	7	4772
17	20090018	萧妹学	50	39709	[缺失]	3907
18	20090019	蒋情另	41	39747	6	5210
19	20090020	琪尔	41	39800	10	237700

1 2	`pd.set_option('max_rows',10) df`

	工号	姓名	年龄	入职时间	销量	单价（元）
0	20090001	苏离	39	39850	5	4157
1	20090002	屈录	35	39812	14	2105
2	20090003	于帝还	30	39795	11	5032
3	20090004	潘雨类	36	39898	10	1774
4	20090005	周财站	37	39709	15	4377
...	...	...	...	...	...	...
15	20090016	喻塞晴	31	39757	12	2915
16	20090017	梁佛	28	39815	7	4772
17	20090018	萧妹学	50	39709	[缺失]	3907
18	20090019	蒋情另	41	39747	6	5210
19	20090020	琪尔	41	39800	10	237700

20 rows × 6 columns

1 2	`# DataFrame 的概念 df.info()`

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 6 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   工号      20 non-null     int64 
 1   姓名      20 non-null     object
 2   年龄      20 non-null     int64 
 3   入职时间    20 non-null     int64 
 4   销量      20 non-null     object
 5   单价（元）   20 non-null     int64 
dtypes: int64(4), object(2)
memory usage: 1.1+ KB

1 2	`# DataFrame 的行列数 df.shape`

(20, 6)

1 2	`# DataFrame 的各变量类型 df.dtypes`

工号        int64
姓名       object
年龄        int64
入职时间      int64
销量       object
单价（元）     int64
dtype: object

1	`df.describe()`

	工号	年龄	入职时间	单价（元）
count	2.000000e+01	20.000000	20.00000	20.000000
mean	2.009001e+07	34.450000	39794.85000	15022.900000
std	5.916080e+00	6.386458	64.55049	52427.732862
min	2.009000e+07	25.000000	39698.00000	1327.000000
25%	2.009001e+07	29.000000	39742.50000	2387.750000
50%	2.009001e+07	35.000000	39797.50000	3505.500000
75%	2.009002e+07	39.000000	39828.25000	4475.750000
max	2.009002e+07	50.000000	39898.00000	237700.000000

1 2	`# DataFrame 的行名称或者叫行索引 df.index`

RangeIndex(start=0, stop=20, step=1)

1 2	`# DataFrame 的列名称 df.columns`

Index(['工号', '姓名', '年龄', '入职时间', '销量', '单价（元）'], dtype='object')

1 2	`# DataFrame 的对象值 df.values`

array([[20090001, '苏离', 39, 39850, '5', 4157],
       [20090002, '屈录', 35, 39812, '14', 2105],
       [20090003, '于帝还', 30, 39795, '11', 5032],
       [20090004, '潘雨类', 36, 39898, '10', 1774],
       [20090005, '周财站', 37, 39709, '15', 4377],
       [20090006, '郎临路', 39, 39813, '7', 4178],
       [20090007, '周沉忙', 29, 39888, '11', 1486],
       [20090008, '柳烟', 29, 39715, '5', 5014],
       [20090009, '[未填写]', 25, 39884, '11', 3386],
       [20090010, '傅师交', 35, 39821, '13', 1820],
       [20090011, '谢际', 29, 39792, '10', 1327],
       [20090012, '凤轻词', 43, 39729, '6', 3625],
       [20090013, '萧冷', 28, 39779, '10', 2642],
       [20090014, '邹己', 29, 39886, '5', 2549],
       [20090015, '窦顺太', 35, 39698, '6', 2482],
       [20090016, '喻塞晴', 31, 39757, '12', 2915],
       [20090017, '梁佛', 28, 39815, '7', 4772],
       [20090018, '萧妹学', 50, 39709, '[缺失]', 3907],
       [20090019, '蒋情另', 41, 39747, '6', 5210],
       [20090020, '琪尔', 41, 39800, '10', 237700]], dtype=object)

1 2	`# 查找某一列 df[['姓名','年龄','销量']]`

	姓名	年龄	销量
0	苏离	39	5
1	屈录	35	14
2	于帝还	30	11
3	潘雨类	36	10
4	周财站	37	15
...	...	...	...
15	喻塞晴	31	12
16	梁佛	28	7
17	萧妹学	50	[缺失]
18	蒋情另	41	6
19	琪尔	41	10

20 rows × 3 columns

1 2	`# 查找数据前几行 df.head()`

	工号	姓名	年龄	入职时间	销量	单价（元）
0	20090001	苏离	39	39850	5	4157
1	20090002	屈录	35	39812	14	2105
2	20090003	于帝还	30	39795	11	5032
3	20090004	潘雨类	36	39898	10	1774
4	20090005	周财站	37	39709	15	4377

1 2	`# 查找数据末尾几行 df.tail()`

	工号	姓名	年龄	入职时间	销量	单价（元）
15	20090016	喻塞晴	31	39757	12	2915
16	20090017	梁佛	28	39815	7	4772
17	20090018	萧妹学	50	39709	[缺失]	3907
18	20090019	蒋情另	41	39747	6	5210
19	20090020	琪尔	41	39800	10	237700

1 2	`# 随机选取多行 df.sample(n=4)`

	工号	姓名	年龄	入职时间	销量	单价（元）
0	20090001	苏离	39	39850	5	4157
13	20090014	邹己	29	39886	5	2549
7	20090008	柳烟	29	39715	5	5014
12	20090013	萧冷	28	39779	10	2642

1 2	`# 指定选取连续多行 df[0:5]`

	工号	姓名	年龄	入职时间	销量	单价（元）
0	20090001	苏离	39	39850	5	4157
1	20090002	屈录	35	39812	14	2105
2	20090003	于帝还	30	39795	11	5032
3	20090004	潘雨类	36	39898	10	1774
4	20090005	周财站	37	39709	15	4377

科技

#Python

2026寒假学习Pyhon_3_day

https://laowan-blog.pages.dev/2026/02/06/2026寒假学习Pyhon-3-day/

作者

老万

发布于

2026年2月6日

许可协议

2026寒假学习Pyhon_4_day 上一篇

2026寒假学习Pyhon_2_day 下一篇