小明:嘿,小李,我最近想试用一下大数据平台,你有什么建议吗?
小李:当然可以!你可以先选择一个主流的大数据平台,比如Hadoop或者Spark。它们都提供了试用环境。
小明:那怎么开始呢?有没有具体的代码示例?
小李:我们可以从一个简单的数据处理任务开始。比如使用Python和Pandas库读取CSV文件并进行基本统计。
小明:听起来不错,能给我看看代码吗?

小李:当然可以,这是个简单的例子:
import pandas as pd
# 读取CSV文件
df = pd.read_csv('data.csv')
# 显示前5行数据
print(df.head())
# 计算平均值
print("平均值:", df.mean())
小明:这个代码看起来很基础,但我明白了。如果我想在大数据平台上运行,应该怎么做?
小李:你可以将代码提交到平台的作业系统中,比如Hadoop的MapReduce或者Spark的集群环境中。这样就能处理更大的数据集了。
小明:明白了,谢谢你的帮助!
小李:不客气,祝你试用顺利!
