0

0

使用 Pandas 加载 Iris 数据集并进行初步分析

碧海醫心

碧海醫心

发布时间:2025-10-18 10:23:01

|

250人浏览过

|

来源于php中文网

原创

使用 pandas 加载 iris 数据集并进行初步分析

本文将详细介绍如何使用 Python 的 Pandas 库加载著名的 Iris(鸢尾花)数据集,并将其转换为数据框(DataFrame)格式。随后,我们将展示如何利用 Pandas 提供的便捷方法,对数据集进行信息查看和描述性统计分析,帮助读者快速了解数据集的结构和特征。

加载 Iris 数据集并创建 DataFrame

首先,我们需要从 sklearn.datasets 模块导入 load_iris 函数,并使用它加载 Iris 数据集。然后,我们将使用 Pandas 的 DataFrame 类,将数据集转换为数据框格式。

from sklearn.datasets import load_iris
import pandas as pd

iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)

这段代码首先导入了必要的库:sklearn.datasets 用于加载数据集,pandas 用于创建和操作数据框。load_iris() 函数返回一个包含数据集所有信息的对象。我们使用 iris.data 获取数据部分,iris.feature_names 获取特征名称,并将它们传递给 pd.DataFrame() 构造函数,从而创建一个名为 df 的数据框。

查看 DataFrame 信息

创建数据框后,我们可以使用 .info() 方法查看其基本信息,包括列名、数据类型、非空值数量等。

df.info()

该方法会输出 DataFrame 的摘要信息,例如:


RangeIndex: 150 entries, 0 to 149
Data columns (total 4 columns):
   Column             Non-Null Count  Dtype
---  ------             --------------  -----
 0   sepal length (cm)  150 non-null    float64
 1   sepal width (cm)   150 non-null    float64
 2   petal length (cm)  150 non-null    float64
 3   petal width (cm)   150 non-null    float64
dtypes: float64(4)
memory usage: 4.8 KB

从输出中可以看出,该数据框包含 150 行数据,4 列特征,所有特征均为 float64 类型,且不存在缺失值。

进行描述性统计分析

接下来,我们可以使用 .describe() 方法对数据框进行描述性统计分析,包括均值、标准差、最小值、最大值、四分位数等。

InstantMind
InstantMind

AI思维导图生成器,支持30+文件格式一键转换,包括PDF、Word、视频等。

下载
df.describe()

该方法会输出 DataFrame 中数值列的统计信息,例如:

       sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)
count         150.000000        150.000000         150.000000        150.000000
mean            5.843333          3.057333           3.758000          1.199333
std             0.828066          0.435866           1.765298          0.762238
min             4.300000          2.000000           1.000000          0.100000
25%             5.100000          2.800000           1.600000          0.300000
50%             5.800000          3.000000           4.350000          1.300000
75%             6.400000          3.300000           5.100000          1.800000
max             7.900000          4.400000           6.900000          2.500000

通过这些统计信息,我们可以初步了解每个特征的分布情况。

DataFrame 样式展示 (可选)

如果需要在 Jupyter Notebook 或类似环境中以更美观的表格形式展示 DataFrame,可以使用 df.style 属性。

df.style

或者,使用 display(df) 函数也能达到类似的效果。

from IPython.display import display
display(df)

这两种方法都能将 DataFrame 以更易读的方式呈现出来,方便数据的浏览和理解。

注意事项

  • df.info() 和 df.describe() 方法本身会直接打印输出结果,不需要将其放在 print() 函数中。如果放在 print() 中,可能会导致输出格式不正确。

总结

本文详细介绍了如何使用 Pandas 加载 Iris 数据集并进行初步分析。通过加载数据集、创建 DataFrame、查看信息和进行描述性统计分析,我们可以快速了解数据集的结构和特征,为后续的数据分析和建模奠定基础。掌握这些基本操作对于数据科学入门至关重要。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

57

2025.12.04

python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

186

2023.09.27

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

309

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

24

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

7

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

28

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

1

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

3

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号