目录

  • 1 认识数据与大数据
    • 1.1 1课 感知数据
    • 1.2 2课 认识信息
    • 1.3 3课 数字化与数制转换
    • 1.4 4课 数据编码与压缩
    • 1.5 5课 数据科学与大数据
  • 2 算法与程序实现
    • 2.1 6课 解决问题的一般过程和用计算机解决问题
    • 2.2 7课 算法的概念及描述
    • 2.3 8课 Python语言基础
    • 2.4 9课 顺序结构的程序实现
    • 2.5 10课 语句与程序结构——单、双分支结构
    • 2.6 11课 语句与程序结构——多分支选择结构
    • 2.7 12课 语句与程序结构——循环结构(while语句)
    • 2.8 13课 语句与程序结构——循环结构(for语句)
    • 2.9 14课 语句与程序结构——循环嵌套及其程序实现
    • 2.10 15课 语句与程序结构——break和continue语句
    • 2.11 16课 基于解析算法的问题解决
    • 2.12 17课 基于枚举算法的问题解决
    • 2.13 18课 算法与程序实现的综合应用1
    • 2.14 19课 算法与程序实现的综合应用2
  • 3 数据处理与应用
    • 3.1 20课 数据处理的一般过程
    • 3.2 21课 数据采集
    • 3.3 22课 数据整理
    • 3.4 23课 数据分析
    • 3.5 24课 数据可视化之图表
    • 3.6 25课 数据可视化之词云
    • 3.7 26课 数据分析报告与应用
  • 4 走进智能时代
    • 4.1 27课 认识人工智能
    • 4.2 28课 人工智能平台中的智能工具
    • 4.3 29课 编程调用平台中的智能工具
    • 4.4 30课 人工智能的应用与影响
23课 数据分析

1.使用Excel对数据进行编辑,计算与筛选等操作。

2.使用pandas标准库编写程序分析数据。

通过“关于大棚蔬菜生长与天气条件关系的研究”的项目体验与探究,按照数据分析的基本方法,选择合适的数据分析工具对数据进行分析处理。

安装有python编辑器的可上网的电脑。

思考并回答以下问题:


“关于大棚蔬菜种植条件的研究”项目中研究大棚蔬菜生长与天气条件关系,在上一次课中,我们使用python语言中的pandas标准库对数据进行了整理,本次课我们需要对整理好的数据进行分析,提取有用的信息,找到与蔬菜种植关系密切的天气因素,进而指导未来蔬菜的种植和管理。

任务:使用Excel软件对文件“天气情况_已整理.csv”进行简单的分析。并思考以下问题:

(1)怎样通过编辑公式计算获得每个月份的最高温度和最低温度平均温度,然后运用对比分析法和平均分析法分析一年中温度的变化。

微课1:平均分析法


操作建议:

一年中的最高温度和最低温度平均温度(运用对比分析发和平均分析法分析)。

 

(2)怎样通过筛选操作获得一年中空气质量为优,良和轻度污染的天数,然后运用结构分析法分析一年中的空气质量情况。

微课2:结构分析法


操作建议:

一年中空气质量为优,良和轻度污染的天数空气质量为优的天数。(运用结构分析法分析)

任务:结合提供的“weatheranalysis1.py”文件,利用pandas标准库进行简单数据分析。并思路以下问题:

(1)怎样查看数据的个数,最大值,最小值和平均值等信息。

微课3:安装pandas库


微课4:统计信息函数


操作建议:

统计信息函数:df.describe()

(2)

微课5:布尔条件统计


①怎样查看最高温度大于35度的信息。

操作建议:

df[df['最高气温']>35]

②怎样查看最低气温小于0度的信息。

操作建议:

df[df['最低气温']<0]

③怎样查看一年中空气质量为优的天数。

操作建议:

data=df[df['空气质量指数'].str.find('优')>0]

data['日期'].count()

(3)

微课6:多布尔条件统计


①怎样查看一年最低气温大于10度并且最高气温小于25度的信息

操作建议:

df.loc[(df['最高气温'] < 25) & (df['最低气温'] >10)]

②怎样查看一年最低气温与最高气温相差13度以上的信息。

操作建议:

df.loc[df['最高气温'] -df['最低气温'] >13

学生

实践活动(A、B、C)

注:A=非常符合,B=符合,C=不符合

自评

教师评

使用统计信息函数



使用布尔条件统计



使用多布尔条件统计



 

任务:结合提供“weatheranalysis2.py”文件,利用pandas标准库进行数据挖掘(按月统计分析)。并思考以下问题:

(1)怎样按月统计的数据。

微课7:数据挖掘


(2)怎样按月统计最高气温,最低气温,最大温差和空气优的天数。

操作建议:

利用pandas标准库对数据进行按月统计本月最高气温,最低气温,最大温差,平均温度和空气优的天数

for i in range(1,13):

date='2018-'+str(i)

maxtemperature.append(df[date]['最高气温'].max())

mintemperature.append(df[date]['最低气温'].min())

disparitytemperature.append(df[date]['最高气温'].max()-df[date]['最低气温'].min())

data=df[date]['最低气温']+df[date]['最高气温']

averagetemperature.append(round(data.mean(),3))

dataq = df[date]['空气质量指数'].str.find('优') > 0

dataf = dataq.to_frame()

datafc = dataf[dataf['空气质量指数'] > 0]

airquality.append(datafc['空气质量指数'].count())

学生

实践活动(A、B、C)

注:A=非常符合,B=符合,C=不符合

自评

教师评

理解按月统计信息



创建新DataFrame



学习认真,积极主动探索



每个小组根据南水北调工程项目制定的项目任务,结合前期的项目数据采集及整理,完成项目的数据分析:

1.根据各组确定的任务主题,确定数据分析的方法。

2.各组对收集到底数据进行数据分析,为可视化做准备。