1.使用Excel对数据进行编辑,计算与筛选等操作。
2.使用pandas标准库编写程序分析数据。
通过“关于大棚蔬菜生长与天气条件关系的研究”的项目体验与探究,按照数据分析的基本方法,选择合适的数据分析工具对数据进行分析处理。
安装有python编辑器的可上网的电脑。
思考并回答以下问题:
“关于大棚蔬菜种植条件的研究”项目中研究大棚蔬菜生长与天气条件关系,在上一次课中,我们使用python语言中的pandas标准库对数据进行了整理,本次课我们需要对整理好的数据进行分析,提取有用的信息,找到与蔬菜种植关系密切的天气因素,进而指导未来蔬菜的种植和管理。
任务:使用Excel软件对文件“天气情况_已整理.csv”进行简单的分析。并思考以下问题:
(1)怎样通过编辑公式计算获得每个月份的最高温度和最低温度平均温度,然后运用对比分析法和平均分析法分析一年中温度的变化。
微课1:平均分析法
操作建议:
一年中的最高温度和最低温度平均温度(运用对比分析发和平均分析法分析)。
(2)怎样通过筛选操作获得一年中空气质量为优,良和轻度污染的天数,然后运用结构分析法分析一年中的空气质量情况。
微课2:结构分析法
操作建议:
一年中空气质量为优,良和轻度污染的天数空气质量为优的天数。(运用结构分析法分析)
任务:结合提供的“weatheranalysis1.py”文件,利用pandas标准库进行简单数据分析。并思路以下问题:
(1)怎样查看数据的个数,最大值,最小值和平均值等信息。
微课3:安装pandas库
微课4:统计信息函数
操作建议:
统计信息函数:df.describe()
(2)
微课5:布尔条件统计
①怎样查看最高温度大于35度的信息。
操作建议:
df[df['最高气温']>35]
②怎样查看最低气温小于0度的信息。
操作建议:
df[df['最低气温']<0]
③怎样查看一年中空气质量为优的天数。
操作建议:
data=df[df['空气质量指数'].str.find('优')>0]
data['日期'].count()
(3)
微课6:多布尔条件统计
①怎样查看一年最低气温大于10度并且最高气温小于25度的信息
操作建议:
df.loc[(df['最高气温'] < 25) & (df['最低气温'] >10)]
②怎样查看一年最低气温与最高气温相差13度以上的信息。
操作建议:
df.loc[df['最高气温'] -df['最低气温'] >13
学生 | 实践活动(A、B、C) 注:A=非常符合,B=符合,C=不符合 | |
自评 | 教师评 | |
使用统计信息函数 | ||
使用布尔条件统计 | ||
使用多布尔条件统计 |
任务:结合提供“weatheranalysis2.py”文件,利用pandas标准库进行数据挖掘(按月统计分析)。并思考以下问题:
(1)怎样按月统计的数据。
微课7:数据挖掘
(2)怎样按月统计最高气温,最低气温,最大温差和空气优的天数。
操作建议:
利用pandas标准库对数据进行按月统计本月最高气温,最低气温,最大温差,平均温度和空气优的天数
for i in range(1,13):
date='2018-'+str(i)
maxtemperature.append(df[date]['最高气温'].max())
mintemperature.append(df[date]['最低气温'].min())
disparitytemperature.append(df[date]['最高气温'].max()-df[date]['最低气温'].min())
data=df[date]['最低气温']+df[date]['最高气温']
averagetemperature.append(round(data.mean(),3))
dataq = df[date]['空气质量指数'].str.find('优') > 0
dataf = dataq.to_frame()
datafc = dataf[dataf['空气质量指数'] > 0]
airquality.append(datafc['空气质量指数'].count())
学生 | 实践活动(A、B、C) 注:A=非常符合,B=符合,C=不符合 | |
自评 | 教师评 | |
理解按月统计信息 | ||
创建新DataFrame | ||
学习认真,积极主动探索 |
每个小组根据南水北调工程项目制定的项目任务,结合前期的项目数据采集及整理,完成项目的数据分析:
1.根据各组确定的任务主题,确定数据分析的方法。
2.各组对收集到底数据进行数据分析,为可视化做准备。