小李:嘿,小王,最近学校要举办迎新活动,我想用一些数据可视化工具来展示新生的基本信息,比如男女比例、专业分布等,你觉得怎么样?
小王:听起来不错!我们可以用Python的Matplotlib库来实现。首先,你需要准备一份包含新生信息的数据集,比如性别、专业等字段。
小李:好的,我已经收集了数据,保存在一个CSV文件里。接下来怎么操作呢?
小王:我们先导入必要的库,并加载数据。然后可以画一个饼图来显示男女比例。
import pandas as pd
import matplotlib.pyplot as plt
# 加载数据
data = pd.read_csv('new_students.csv')
# 计算男女比例
gender_counts = data['Gender'].value_counts()
# 绘制饼图
plt.figure(figsize=(6, 6))
plt.pie(gender_counts, labels=gender_counts.index, autopct='%1.1f%%', startangle=90)
plt.title('新生性别比例')
plt.axis('equal') # 使饼图为正圆
plt.show()
]]>
小李:哇,效果很棒!接下来,我们还能做些什么呢?
小王:我们可以再做一个条形图,展示不同专业的学生人数。这样可以让新生和家长更直观地了解学校的学科分布。
# 计算各专业的学生人数
major_counts = data['Major'].value_counts()
# 绘制条形图
plt.figure(figsize=(10, 6))
plt.bar(major_counts.index, major_counts.values, color='skyblue')
plt.xlabel('专业')
plt.ylabel('人数')
plt.title('新生专业分布')
plt.xticks(rotation=45) # 倾斜标签便于阅读
plt.tight_layout() # 自动调整布局
plt.show()
]]>
小李:太好了!这些图表不仅美观,还很实用。最后,你觉得还有哪些可以改进的地方吗?
小王:我们可以尝试将这些图表嵌入到网页上,方便更多人查看。这需要用到Flask这样的框架。
小李:明白了,谢谢你的帮助!我现在对数据可视化有了更深的理解。