当前位置:首页 > Python > 正文内容

[Python 教程] Pandas 数据分析实战

admin2个月前 (03-18)Python77

Pandas 数据分析实战

Pandas 是 Python 数据分析的核心库,提供 DataFrame 和 Series 数据结构。本文介绍 Pandas 的实用技巧。

一、创建 DataFrame

import pandas as pd
import numpy as np

# 从字典创建
df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'city': ['NYC', 'LA', 'Chicago']
})

# 从 CSV 读取
# df = pd.read_csv('data.csv')

# 从 Excel 读取
# df = pd.read_excel('data.xlsx')

二、数据查看

df.head()      # 前 5 行
df.tail()      # 后 5 行
df.info()      # 数据信息
df.describe()  # 统计描述
df.shape       # (行数,列数)
df.columns     # 列名

三、数据选择

# 选择列
df['name']
df[['name', 'age']]

# 选择行
df.loc[0]       # 标签索引
df.iloc[0]      # 位置索引
df.loc[0:2]     # 行范围

# 条件筛选
df[df['age'] > 30]
df[(df['age'] > 25) & (df['city'] == 'NYC')]

四、数据处理

# 添加列
df['salary'] = [50000, 60000, 70000]

# 删除列
df.drop('city', axis=1, inplace=True)

# 重命名
df.rename(columns={'name': 'full_name'}, inplace=True)

# 排序
df.sort_values('age', ascending=False)

# 去重
df.drop_duplicates()

五、数据统计

df['age'].mean()    # 平均值
df['age'].median()  # 中位数
df['age'].std()     # 标准差
df['age'].value_counts()  # 值计数
df.groupby('city')['age'].mean()  # 分组统计

六、处理缺失值

# 检查缺失值
df.isnull().sum()

# 删除缺失值
df.dropna()

# 填充缺失值
df.fillna(0)
df['age'].fillna(df['age'].mean())

相关文章

[Python 教程] NumPy 数组操作详解

NumPy 数组操作详解 NumPy 是 Python 科学计算的基础库,提供高性能的多维数组对象。本文详细介绍 NumPy 数组的核心操作。 一、创建数组 import numpy as np...

[Python 教程] Python 多线程编程指南

Python 多线程编程指南 Python 的 threading 模块提供多线程支持。本文介绍多线程编程的基础和实用技巧。 一、创建线程 import threading import time...

深入理解 Python 上下文管理器:从基础到高级应用

Python 的 with 语句和上下文管理器是每个开发者都应该掌握的高级技巧,但很多初学者对它的理解仅仅停留在文件操作层面。本文将深入讲解上下文管理器的原理、多种实现方式,以及在实际开发中的高级应用...

Python 中利用 functools.lru_cache 实现高效缓存:从入门到进阶

Python 中利用 functools.lru_cache 实现高效缓存:从入门到进阶 在日常 Python 开发中,我们经常会遇到重复计算相同输入的问题,比如递归计算斐波那契数列、多次调用相同参...

Python装饰器完全指南:从原理到实战

Python 装饰器(Decorator)是 Python 中最强大也是最优雅的特性之一。它允许你在不修改原函数代码的情况下,动态地给函数添加功能。这种设计模式体现了 AOP(面向切面编程)的思想,让...

Python 异常处理的最佳实践与高级技巧

在 Python 开发中,异常处理是编写健壮程序的核心技能。虽然大多数开发者都熟悉基本的 try-except 语法,但在实际项目中,如何优雅地处理异常、提供有意义的错误信息、避免吞掉重要错误,这些都...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。