Plotly Express是一个基于Plotly库的高级Python可视化库。它旨在使绘图变得简单且直观,无需繁琐的设置和配置。通过使用Plotly Express,您可以使用少量的代码创建具有丰富交互性和专业外观的各种图表。以下是Plotly Express的一些主要特点和优势:
-
简单易用:Plotly Express提供了一组直观的函数和方法,使得创建各种类型的图表变得非常简单。您可以使用少量的代码生成复杂的图表,而无需深入了解底层的绘图细节。
-
支持多种图表类型:Plotly Express支持多种常见的图表类型,包括散点图、线图、柱状图、饼图、箱线图、等高线图、地图等。您可以根据需要选择合适的图表类型来呈现数据。
-
内置交互性:通过使用Plotly Express,您可以轻松地为生成的图表添加交互功能。您可以缩放、平移、选择数据点、查看工具提示等,以便更好地探索数据和图表。
-
自动美化:Plotly Express会自动为生成的图表添加专业的样式和外观。这意味着您不需要手动进行大量的配置和调整,即可获得漂亮的图表。当然,您也可以通过一些参数来自定义图表的外观。
-
整合Plotly图表生态系统:Plotly Express是Plotly图表生态系统的一部分,可以与其他Plotly库和工具进行无缝集成。您可以将Plotly Express与Plotly的其他组件(如Dash)一起使用,构建交互性强大的数据可视化应用程序。
Plotly Express与matplotlib和pyecharts相比有以下几个优势:
-
交互性:Plotly Express内置了交互性,使用户能够在图表中进行缩放、平移、选择数据点以及查看工具提示等操作。这种交互性使得数据的探索和分析变得更加直观和灵活。而matplotlib和pyecharts在交互性方面相对有限。
-
美观性:Plotly Express提供了一组精心设计的默认样式,使得生成的图表外观美观并具有专业感。您可以获得漂亮的图表,而无需过多的配置和调整。相比之下,matplotlib需要更多的手动配置来实现类似的外观,而pyecharts则提供了一些模板和预设主题,但美观性较Plotly Express稍逊一筹。
-
多种图表类型:Plotly Express支持多种常见的图表类型,包括散点图、线图、柱状图、饼图、箱线图、等高线图、地图等。这使得用户可以根据需要选择最适合的图表类型来呈现数据。matplotlib也提供了多种图表类型,但在某些类型的图表上,Plotly Express的绘制和配置更为简单和直观。
-
Pythonic接口:Plotly Express的API设计符合Pythonic风格,使用起来更加直观和易于理解。它提供了一组简洁的函数和方法,使用户能够以一种自然的方式生成图表。相比之下,matplotlib的API较为繁琐,需要更多的代码来实现相同的效果,而pyecharts则使用了类似于JavaScript的配置方式。
-
与Plotly生态系统的集成:Plotly Express是Plotly图表生态系统的一部分,与其他Plotly库和工具无缝集成。这意味着您可以将Plotly Express与其他Plotly组件(如Dash)一起使用,构建交互性强大的数据可视化应用程序。这种集成性使得Plotly Express成为一个功能丰富且灵活的选择。
import pandas as pd
import plotly_express as pxgapminder = pd.DataFrame(px.data.gapminder())
gapminder.rename(columns={"year": "年份", "country": "国家", "continent": "所在洲","lifeExp": "预期寿命", "pop": "人口", "gdpPercap": "人均GDP","iso_alpha": "ISO国家代码", "iso_num": "ISO数字代码"}, inplace=True)
gapminder['所在洲'] = gapminder["所在洲"].map({"Asia": "亚洲", "Europe": "欧洲","Africa": "非洲", "Americas": "美洲", "Oceania": "大洋洲"})
# line 图
fig = px.line(gapminder, # 数据集x="年份", # 横坐标y="预期寿命", # 纵坐标color="所在洲", # 颜色的数据line_group="所在洲", # 线性分组hover_name="国家", # 悬停hover的数据line_shape="spline", # 线的形状render_mode="svg" # 生成的图片模式
)
fig.show()# area 图
fig = px.area(gapminder, # 数据集x="年份", # 横坐标y="人口", # 纵坐标color="所在洲", # 颜色line_group="国家" # 线性组别
)
fig.show()fig = px.scatter(gapminder # 绘图DataFrame数据集, x="人均GDP" # 横坐标, y="预期寿命" # 纵坐标, color="所在洲" # 区分颜色, size="人口" # 区分圆的大小, size_max=60 # 散点大小
)
fig.show()fig = px.scatter(gapminder # 绘图使用的数据, x="人均GDP" # 横纵坐标使用的数据, y="预期寿命" # 纵坐标数据, color="所在洲" # 区分颜色的属性, size="人口" # 区分圆的大小, size_max=60 # 圆的最大值, hover_name="国家" # 图中可视化最上面的名字, animation_frame="年份" # 横轴滚动栏的属性year, animation_group="国家" # 标注的分组, facet_col="所在洲" # 按照国家country属性进行分格显示, log_x=True # 横坐标表取对数, range_x=[100, 100000] # 横轴取值范围, range_y=[25, 90] # 纵轴范围, labels=dict(pop="人口", # 属性名字的变化,更直观gdpPercap="人均GDP",lifeExp="预期寿命")
)
fig.show()fig = px.choropleth(gapminder, # 数据集locations="ISO国家代码", # 配合颜色color显示color="预期寿命", # 颜色的字段选择hover_name="国家", # 悬停字段名字animation_frame="年份", # 注释color_continuous_scale=px.colors.sequential.Plasma, # 颜色变化projection="natural earth" # 全球地图
)
fig.show()fig = px.scatter_geo(gapminder, # 数据locations="ISO国家代码", # 配合颜色color显示color="所在洲", # 颜色hover_name="国家", # 悬停数据size="人口", # 大小animation_frame="年份", # 数据帧的选择projection="natural earth" # 全球地图
)
fig.show()fig = px.line_geo(gapminder, # 数据集locations="ISO国家代码", # 配合和color显示数据color="所在洲", # 颜色projection="orthographic") # 球形的地图
fig.show()iris = pd.DataFrame(px.data.iris())
iris.rename(columns={"sepal_width": "花萼宽度", "sepal_length": "花萼长度", "petal_width": "花瓣宽度","petal_length": "花瓣长度", "species": "品种", "species_id": "品种编号"}, inplace=True)
iris['品种'] = iris["品种"].map({"setosa": "山鸢尾", "versicolor": "变色鸢尾","virginica": "维吉尼亚鸢尾"})fig = px.scatter(iris, # 数据集x="花萼宽度", # 横坐标y="花萼长度" # 纵坐标
)
fig.show()fig = px.scatter(iris, # 数据集x="花萼宽度", # 横坐标y="花萼长度", # 纵坐标color="品种", # 颜色marginal_x="histogram", # 横坐标直方图marginal_y="rug" # 细条图
)
fig.show()fig = px.scatter(iris, # 数据集x="花萼宽度", # 横坐标y="花萼长度", # 纵坐标color="品种", # 颜色marginal_y="violin", # 纵坐标小提琴图marginal_x="box", # 横坐标箱型图trendline="ols" # 趋势线
)
fig.show()fig = px.scatter_matrix(iris, # 数据dimensions=["花萼宽度", "花萼长度", "花瓣宽度", "花瓣长度"], # 维度选择color="品种") # 颜色
fig.show()fig = px.parallel_coordinates(iris, # 数据集color="品种编号", # 颜色labels={"品种编号": "品种", # 各种标签值"花萼宽度": "花萼宽度","花萼长度": "花萼长度","花瓣长度": "花瓣长度","花瓣宽度": "花瓣宽度"},color_continuous_scale=px.colors.diverging.Tealrose,color_continuous_midpoint=2)
fig.show()fig = px.density_contour(iris, # 数据集x="花萼宽度", # 横坐标值y="花萼长度", # 纵坐标值color="品种", # 颜色marginal_x="rug", # 横轴为线条图marginal_y="histogram" # 纵轴为直方图
)
fig.show()wind = pd.DataFrame(px.data.wind())
wind.rename(columns={"frequency": "频率", "direction": "方向", "strength": "强度"}, inplace=True)
fig = px.bar_polar(wind, # 数据集r="频率", # 半径theta="方向", # 角度color="强度", # 颜色template="plotly_dark", # 主题color_discrete_sequence=px.colors.sequential.Plasma_r) # 颜色变化
fig.show()