2026寒假学习Pyhon_3_day

1
2
3
# 查看pandas的版本
import pandas as pd
print(pd.__version__)
1
2
3
4
5
import pandas as pd
df = pd.read_excel(r"C:\Users\58760\Documents\Python Study\Pandas基础.xlsx",
engine='openpyxl')
df
# df['销售额(元)']=df['销量']*df['单价(元)']

工号 姓名 年龄 入职时间 销量 单价(元)
0 20090001 苏离 39 39850 5 4157
1 20090002 屈录 35 39812 14 2105
2 20090003 于帝还 30 39795 11 5032
3 20090004 潘雨类 36 39898 10 1774
4 20090005 周财站 37 39709 15 4377
5 20090006 郎临路 39 39813 7 4178
6 20090007 周沉忙 29 39888 11 1486
7 20090008 柳烟 29 39715 5 5014
8 20090009 [未填写] 25 39884 11 3386
9 20090010 傅师交 35 39821 13 1820
10 20090011 谢际 29 39792 10 1327
11 20090012 凤轻词 43 39729 6 3625
12 20090013 萧冷 28 39779 10 2642
13 20090014 邹己 29 39886 5 2549
14 20090015 窦顺太 35 39698 6 2482
15 20090016 喻塞晴 31 39757 12 2915
16 20090017 梁佛 28 39815 7 4772
17 20090018 萧妹学 50 39709 [缺失] 3907
18 20090019 蒋情另 41 39747 6 5210
19 20090020 琪尔 41 39800 10 237700
1
2
pd.set_option('max_rows',10)
df

工号 姓名 年龄 入职时间 销量 单价(元)
0 20090001 苏离 39 39850 5 4157
1 20090002 屈录 35 39812 14 2105
2 20090003 于帝还 30 39795 11 5032
3 20090004 潘雨类 36 39898 10 1774
4 20090005 周财站 37 39709 15 4377
... ... ... ... ... ... ...
15 20090016 喻塞晴 31 39757 12 2915
16 20090017 梁佛 28 39815 7 4772
17 20090018 萧妹学 50 39709 [缺失] 3907
18 20090019 蒋情另 41 39747 6 5210
19 20090020 琪尔 41 39800 10 237700

20 rows × 6 columns

1
2
# DataFrame 的概念
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 6 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   工号      20 non-null     int64 
 1   姓名      20 non-null     object
 2   年龄      20 non-null     int64 
 3   入职时间    20 non-null     int64 
 4   销量      20 non-null     object
 5   单价(元)   20 non-null     int64 
dtypes: int64(4), object(2)
memory usage: 1.1+ KB
1
2
# DataFrame 的行列数
df.shape
(20, 6)
1
2
# DataFrame 的各变量类型
df.dtypes
工号        int64
姓名       object
年龄        int64
入职时间      int64
销量       object
单价(元)     int64
dtype: object
1
df.describe()

工号 年龄 入职时间 单价(元)
count 2.000000e+01 20.000000 20.00000 20.000000
mean 2.009001e+07 34.450000 39794.85000 15022.900000
std 5.916080e+00 6.386458 64.55049 52427.732862
min 2.009000e+07 25.000000 39698.00000 1327.000000
25% 2.009001e+07 29.000000 39742.50000 2387.750000
50% 2.009001e+07 35.000000 39797.50000 3505.500000
75% 2.009002e+07 39.000000 39828.25000 4475.750000
max 2.009002e+07 50.000000 39898.00000 237700.000000
1
2
# DataFrame 的行名称或者叫行索引
df.index
RangeIndex(start=0, stop=20, step=1)
1
2
# DataFrame 的列名称
df.columns
Index(['工号', '姓名', '年龄', '入职时间', '销量', '单价(元)'], dtype='object')
1
2
# DataFrame 的对象值
df.values
array([[20090001, '苏离', 39, 39850, '5', 4157],
       [20090002, '屈录', 35, 39812, '14', 2105],
       [20090003, '于帝还', 30, 39795, '11', 5032],
       [20090004, '潘雨类', 36, 39898, '10', 1774],
       [20090005, '周财站', 37, 39709, '15', 4377],
       [20090006, '郎临路', 39, 39813, '7', 4178],
       [20090007, '周沉忙', 29, 39888, '11', 1486],
       [20090008, '柳烟', 29, 39715, '5', 5014],
       [20090009, '[未填写]', 25, 39884, '11', 3386],
       [20090010, '傅师交', 35, 39821, '13', 1820],
       [20090011, '谢际', 29, 39792, '10', 1327],
       [20090012, '凤轻词', 43, 39729, '6', 3625],
       [20090013, '萧冷', 28, 39779, '10', 2642],
       [20090014, '邹己', 29, 39886, '5', 2549],
       [20090015, '窦顺太', 35, 39698, '6', 2482],
       [20090016, '喻塞晴', 31, 39757, '12', 2915],
       [20090017, '梁佛', 28, 39815, '7', 4772],
       [20090018, '萧妹学', 50, 39709, '[缺失]', 3907],
       [20090019, '蒋情另', 41, 39747, '6', 5210],
       [20090020, '琪尔', 41, 39800, '10', 237700]], dtype=object)
1
2
# 查找某一列
df[['姓名','年龄','销量']]

姓名 年龄 销量
0 苏离 39 5
1 屈录 35 14
2 于帝还 30 11
3 潘雨类 36 10
4 周财站 37 15
... ... ... ...
15 喻塞晴 31 12
16 梁佛 28 7
17 萧妹学 50 [缺失]
18 蒋情另 41 6
19 琪尔 41 10

20 rows × 3 columns

1
2
# 查找数据前几行
df.head()

工号 姓名 年龄 入职时间 销量 单价(元)
0 20090001 苏离 39 39850 5 4157
1 20090002 屈录 35 39812 14 2105
2 20090003 于帝还 30 39795 11 5032
3 20090004 潘雨类 36 39898 10 1774
4 20090005 周财站 37 39709 15 4377
1
2
# 查找数据末尾几行
df.tail()

工号 姓名 年龄 入职时间 销量 单价(元)
15 20090016 喻塞晴 31 39757 12 2915
16 20090017 梁佛 28 39815 7 4772
17 20090018 萧妹学 50 39709 [缺失] 3907
18 20090019 蒋情另 41 39747 6 5210
19 20090020 琪尔 41 39800 10 237700
1
2
# 随机选取多行
df.sample(n=4)

工号 姓名 年龄 入职时间 销量 单价(元)
0 20090001 苏离 39 39850 5 4157
13 20090014 邹己 29 39886 5 2549
7 20090008 柳烟 29 39715 5 5014
12 20090013 萧冷 28 39779 10 2642
1
2
# 指定选取连续多行
df[0:5]

工号 姓名 年龄 入职时间 销量 单价(元)
0 20090001 苏离 39 39850 5 4157
1 20090002 屈录 35 39812 14 2105
2 20090003 于帝还 30 39795 11 5032
3 20090004 潘雨类 36 39898 10 1774
4 20090005 周财站 37 39709 15 4377
1


2026寒假学习Pyhon_3_day
https://laowan-blog.pages.dev/2026/02/06/2026寒假学习Pyhon-3-day/
作者
老万
发布于
2026年2月6日
许可协议