小明:嘿,小李,最近我在做一个数据分析的项目,遇到了一些问题,能帮我看看吗?
小李:当然可以,你遇到什么问题了?
小明:我需要从一个CSV文件中提取数据,然后进行一些基本的清洗和统计。你知道有什么好的方法吗?
小李:你可以用Python的pandas库来做这个。它非常强大,而且简单易用。
小明:那你能给我写个例子吗?我想看看怎么操作。
小李:没问题。首先,你需要导入pandas:
import pandas as pd
然后读取CSV文件:
df = pd.read_csv('data.csv')
接下来,你可以查看数据的基本信息:
print(df.head())
如果有缺失值,可以用以下代码填充或删除:
df.fillna(0, inplace=True) # 或者 df.dropna(inplace=True)
最后,你可以做简单的统计:
print(df.describe())
小明:太好了,这样就能处理资料了。那如果我要保存处理后的数据呢?
小李:很简单,使用`to_csv`方法就可以:
df.to_csv('processed_data.csv', index=False)
小明:明白了,谢谢你的帮助!
小李:不客气,如果你还有其他问题,随时问我。