博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据分析图例
阅读量:5979 次
发布时间:2019-06-20

本文共 1267 字,大约阅读时间需要 4 分钟。

1、饼图 (pandas)

用于分析一种特征中两种数值所占比例。

train_data['Survived'].value_counts().plot.pie(autopct='%1.2f%%')

  

 

2、柱状图(pandas)

分析两维特征间的关系。

train_data[['Sex', 'Survived']].groupby(['Sex']).mean().plot.bar()

 

sns的柱状图(pandas)

sns.countplot('Embarked', hue='Survived', data=train_data)

 

 

3、直方图(pandas)

是一种可视化在连续间隔,或者是特定时间段内数据分布情况的图表。直方图描述的是一组数据的频次分布。

柱状图展示的不同分类的数量分布。

train_data['Age'].hist(bins=70)

 bins,数据划分的份数。

 

sns提供的直方图 (pandas, seaborn)

average_data = train_data[['age_int', 'Survived']].groupby('age_int', as_index=False).mean()sns.barplot(x='age_int', y='Survived', data=average_data)

 

 

5、琴图 (seaborn)

 在柱状图的基础上,琴图展示的内容可以更加丰富,可以同时展示三个数值间的关系。下图展示了不同Pclass下的不同年龄的生还和死亡的人数的比例。

琴图的黑线上,同时可以看到年龄的分布,黑线上粗线的两端表示年龄的最小和最大值,白色的点表示年龄的平均值。

用于分析这里使用seaborn(matplotlib的一个扩展库)

import seaborn as snssns.violinplot('Pclass', 'Age', hue='Survived', data=train_data, split=True, ax=ax[0])

 

 6、箱型图 (pandas)

 箱型图和琴图中的黑线表示类似。

a) 箱图的上下连个黑线:最小和最大值。

b) 中间方框的上下边缘:上四分位数和下四分位数。

c) 绿线:中位数

d) 圆点:异常值

showfilters,是否展示异常值。

train_data.boxplot(column='Age', showfliers=False)

train_data.boxplot(column='Fare', by='Pclass', showfliers=True)

7、密度图 (seaborn)

facet = sns.FacetGrid(train_data, hue='Survived', aspect=4)# kdeplot,密度图facet.map(sns.kdeplot, 'Age', shade=True)

 

 

 

转载于:https://www.cnblogs.com/jimobuwu/p/9905304.html

你可能感兴趣的文章
expdp 详解及实例
查看>>
通过IP判断登录地址
查看>>
深入浅出JavaScript (五) 详解Document.write()方法
查看>>
Beta冲刺——day6
查看>>
在一个程序中调用另一个程序并且传输数据到选择屏幕执行这个程序
查看>>
代码生成工具Database2Sharp中增加视图的代码生成以及主从表界面生成功能
查看>>
关于在VS2005中编写DLL遇到 C4251 警告的解决办法
查看>>
提高信息安全意识对网络勒索病毒说不
查看>>
我的友情链接
查看>>
IDE---Python IDE之Eric5在window下的安装
查看>>
基本安装lnmp环境
查看>>
logstash消费阿里云kafka消息
查看>>
Oracle——条件控制语句
查看>>
day-6 and day-7:面向对象
查看>>
CSU Double Shortest Paths 湖南省第十届省赛
查看>>
webgl像机世界
查看>>
php正则怎么使用(最全最细致)
查看>>
javascript数学运算符
查看>>
LC.155. Min Stack(非优化,两个stack 同步 + -)
查看>>
交互设计[3]--点石成金
查看>>