信息技术_高中_粤教版_2019_必修1_知识点
⑴信息技术_高中_粤教版_2019_必修1-2_知识点及练习题.rar
https://files.cnblogs.com/files/blogs/706040/信息技术_高中_粤教版_2019_必修1-2_知识点及练习题.rar
粤教版信息技术必修一《数据与计算》
第一章 数据与信息
【知识梳理】
一、数据及其特征
(一)数据的概念
数据是现实世界客观事物的符号记录,是信息的载体,是计算机加工的对象。
(二)数据的基本特征
1.二进制。在计算机中,数据以二进制的形式存储、加工。
2.语义性。语义是将数据符号解释为客观世界的事物。
3.分散性。数据是分散的记录,分别记录不同客观事物的运动状态。
4.多样性与感知性。数据记录的形式是多样的、可看的、可听的、可感知的。
二、数据编码
(一)模拟信号与数字信号
1.模拟信号:指用连续变化的物理量所表达的信息;有线电视,无线广播等。
2.数字信号:是离散时间信号的数字化表示。
(二)编码的基本方式
1.文字编码
(1)单字节码:ASCII码、莫尔斯码
ü ASCII码由8位二进制码组成,可表示128个字符;
ü ASCII码中大小写字母间相差32,A-Z,a-z的编码数值依次递增;
ü ASCII码中A的编码是01000001(65),a的编码是01100001(97)。
(2)双字节码:国际码(GBK),统一码(Unicode)
2.图像编码
(1)位图图像编码
位图,最小单位为光栅点(像素),也叫做点阵图或像素图。
(2)位图文件大小
ü 在计算机二进制数系统中,数据存储最小单位是位(bit);
ü 1bit可存储1个0或1, 8个位被称为1个字节(Byte);
ü 1B=8b,1KB=1024B,1MB=1024KB,1GB=1024MB…
ü 位图文件大小(B)=文件头(14B)+信息头(40B)+分辨率*量化位数/8+颜色表项(4*2**量化位数)(量化位数为24时,颜色表项为0)
3.声音编码
ü 模拟信号数字化的步骤:采样、量化、编码。
ü 声音存储空间=采样频率(Hz)×量化位数(bit)×声道数×时间(秒)/8
三、信息及其特征
(一)信息的概念
信息是经过加工处理的、具有意义的数据。
(二)信息的特征
1.普遍性
2.传递性
3.共享性
4.依附性和可处理性
5.时效性
6.真伪性
7.价值相对性
第二章 知识与数字化学习
【知识梳理】
一、知识与智慧
(一)知识
1.发现知识的途径:做实验—>获取观察数据—>分析处理数据—>推理建立数学模型—>实验验证模型—>形成知识—>应用知识解决问题。
2.知识:人们运用大脑对获取或积累的信息进行系统化地提炼﹑研究和分析的结果,能够精确地反映事物的本质。知识是结构化的信息。
(二)智慧
智慧是为了达到预定日标而运用知识解决问题的创新思维能力。
(三)数据、信息、知识与智慧之间的关系
数据、信息、知识和智慧是逐层递进的概念,前者是后者的基础和前提,后者是前者的抽象与升华。
(四)科学研究的方法
1.理论方法:以数学学科为代表
2.实验方法:以物理学科为代表
3.计算方法:利用计算工具
二、数字化学习与创新
(一)数字化工具与资源
1.数字化工具:能够采集、获取、检索、表示、传输、存储和加工多媒体数字化资源的设备装置。按其功能不同,数字化工具可大致分为以下几种:
(1)数据采集(模数转换)工具:声卡、视频卡、数码照相机、数码录像机、手写板、扫描仪等。
(2)信息获取工具:台式电脑、笔记本电脑、平板电脑、手机等。
(3)信息检索工具:搜索引擎、电子词典等。
(4)数字化可视化表达工具:思维导图、演示文稿等。
(5)信息通信交流与传输工具:电子邮件、博客、社交软件、视频会议系统等。
(6)信息存储工具:光盘、U盘、硬盘、服务器等。
(7)信息加工工具:编程软件、多媒体制作软件、网站制作工具、信息系统制作工具等。
(8)三维设计工具:3D制作软件、3D打印机、虚拟现实、增强现实制作系统等。
2.数字化资源:经过数字化工具处理,可以在多媒体计算机上或网络环境下运行的,且可以实现共享的多媒体材料。
(二)数字化工具与资源的优势
1. 数字化工具与资源的优势
(1)获取的便捷性:不守时空限制,随时随地可获取。
(2)形式的多样性:文本、图像、声音、动画、视频等。
(3)资源的共享性:不易不断利用、复制、传递、再生。
(4)平台的互动性:可以双向交流。
(5)内容的扩展性:可操作性、可再生性;可以被评价、修改、再生产。
2.数字化学习的特点
(1)问题化:产生学习的根本原因是问题。
(2)合作性:提供了一个信息交流、资源共享和协作学习的环境。
(3)个性化:学习者可以根据自己的特点自行安排学习进度。
(4)创造性和再生性:数字化学习的再生性可激发学习者的创造力。
(5)开放性:随时随地可以学习,虚拟学习、虚拟课堂、碎片化学习。
(二)体验数字化创新学习过程
1.投针实验:采用蒙特卡洛方法。
⒉思维导图:XMind、 Mindmanager ,Free-Mind等
第三章 算法基础
【知识梳理】
二、体验计算机解决问题的过程
(一)人工解决问题的过程
明确问题和给出条件—>根据经验和知识确定解决问题的方法—>解决问题
(二)计算机解决问题的过程
分析问题—>设计算法—>编写程序—>调试运行程序
二、算法及其描述
(一)算法
1.概念:在有限步骤内求解某一问题所使用的一组定义明确的规则。用计算机求解某一问题的方法,是能被机械执行的动作或指令的有穷集合。
(二)算法的特征
1.有穷性:一个算法在执行有穷步之后必须结束。(不能无限循环)
2.确定性:算法执行的每一步骤必须有确切的定义。(不能模棱两可)
3.数据输入:一个算法必须有零个或者多个输入。(输入>=0)
4.数据输出:一个算法有一个或多个输出,以反映对输入数据加工后的结果,没有输出的算法是毫无意义的。(输出>=1)
5.可行性:算法中执行的任何计算步骤都可以被分解为基本的可自行的操作步骤,即每一个计算步骤都可以在有限时间内完成。
(三)算法的描述
1.自然语言描述:用人们日常所用的语言进行算法描述。
2.流程图描述:用程序框架图来描述算法的一种表示方法。
图形 |
名称 |
功能 |
开始/结束 |
表示算法的开始或结束 |
|
输入/输出 |
表示算法中变量的输入或输出 |
|
处理 |
表示算法中变量的计算与赋值 |
|
判断 |
表示算法中的条件判断 |
3.伪代码描述:用介于自然语言和计算机语言之间的文字和符号来描述算法。它不用图形符号,书写方便,易理解,便于向计算机程序语言过渡
(四)三种基本控制结构
顺序结构 选择结构 循环结构
三、计算机程序与程序设计语言
(一)计算机程序
1.概念:为了得到某种结构而可以由计算机等具有信息处理能力的装置执行的代码化指令序列。(计算机可以识别运行的指令集合)
(二)计算机的组成
1.输入设备:键盘、鼠标…
2.输出设备:显示器、打印机…
3.控制器:对程序规定的控制信息进行解释
4.运算器:对数据进行各种算术运算和逻辑运算
5.存储器:存储程序、数据、信号、命令等信息,并在需要时提供这些信息。
6.计算机之父:冯诺依曼
7.冯诺依曼体系结构:存储程序、程序控制
(三)计算机程序设计语言
1.机器语言:由0、1组成,计算机能直接识别执行
2.汇编语言:类似于英语缩略词的符号语言,计算机需翻译编译才能执行
3.高级语言:接近数学语言或自然语言,计算机需翻译编译才能执行。例如:python、c++、Java等编程语言。
第四章 程序设计基础
一、Python的常量和变量
常量:常量是指在程序运行过程中其值始终不发生变化的量,通常是固定的数值或字符串,在程序中可以直接使用。
变量:变量是指在程序运行过程中其值可以发生变化的量,变量由变量的标识符(变量名)和变量的内容(赋值)两部分组成。
变量的命名:标识符由字母(A-Z,a-z)、数字(0-9)、下划线( _ )组成。 注意:第一个字符必须是字母或下划线,不能是数字,如a1、_a;同时,字母区分大小写,如X和x、sum和Sum都是不同的标识符。
变量的赋值:x=3表示将“=”右边的值赋给左边的变量。
二、Python的数据类型
(1) Python支持以下三种不同的数值类型:
整型(int):通常被称为整型或整数,是不带小数的数。
浮点型(float):浮点型由整数部分与小数部分组成,如2.5。
复数(complex):复数由实数部分和虚数部分构成,可以用a+bj或者complex(a,b)表示,复数的实部a和虚部b都是浮点型。
(2)String(字符串):
字符串是以单引号或双引号括起来的文本,如‘abc’、"xyz"等。字符串的索引从0开始,-1 为从末尾开始的位置。索引号写在方括号[ ]里,以确定数据位置。
(3) List(列表):
列表是写在方括号“[ ]”之间、用逗号分隔开的元素列表,列表的数据项不需要具有相同的类型。与字符串的索引一样,列表索引从0开始。
三、Python的运算符与表达式
(1)算术运算符与算术表达式
算术运算符 |
含义 |
例子 |
结果 |
+ |
加 |
5+2 |
7 |
- |
减 |
5-2 |
3 |
* |
乘 |
5*2 |
10 |
/ |
除 |
5/2 |
2.5 |
// |
整除 |
5//2 |
2 |
% |
求余 |
5%2 |
1 |
** |
幂运算 |
5**2 |
25 |
(2)逻辑运算符与逻辑表达式
逻辑运算符 |
逻辑表达式 |
描述 |
示例(a=0;b=1;c=2) |
and |
x and y |
x为false,则返回false,否则返回y的计算值 |
(a and b)返回0 (c and b)返回1 |
or |
x or y |
x为true,则返回x的值,否则返回y的计算值 |
(a or b)返回1 (c or b)返回2 |
not |
not x |
x为true返回false; x为false返回true |
not(a and b)返回true |
(3) 关系运算符与关系表达式
由关系运算符连接而成的表达式称为关系表达式。关系表达式的值:True、False,对应整数1和0。
关系运算符 |
含义 |
示例 |
结果 |
> |
大于 |
4>3 |
true |
>= |
大于等于 |
3>=3 |
true |
< |
小于 |
4<3 |
false |
<= |
小于等于 |
4<=3 |
true |
== |
等于 |
4==3 |
fasle |
!= |
不等于 |
4!=3 |
true |
(4) 赋值运算符与赋值表达式
对变量的赋值通过赋值运算符“=”来完成。赋值号不是等号,具有方向性,由右边赋给左边的变量。除了“=”外,还有以下赋值运算符。
赋值运算符 |
含义 |
示例 |
|
= |
直接赋值 |
x=y |
|
+= |
加法赋值 |
x+=y |
相当于x=x+y |
-= |
减法赋值 |
x-=y |
相当于x=x-y |
*= |
乘法赋值 |
x*=y |
相当于x=x*y |
/= |
除法赋值 |
x/=y |
相当于x=x/y |
//= |
整除赋值 |
x//=y |
相当于x=x//y |
%= |
求余赋值 |
x%=y |
相当于x=x%y |
**= |
指数幂赋值 |
x**=y |
相当于x=x**y |
(5) 成员运算符
Python中用成员运算符判断序列中是否有某个成员。
成员运算符 |
描述 |
示例 |
in |
x in y,如果x是序列y的成员,则计算结果为true,否则为false |
3 in[1,2,3,4]结果为true 5 in[1,2,3,4]结果为false |
not in |
x not in y,如果x不是序列y的成员,则计算结果为true,否则为false |
3 not in[1,2,3,4]结果为false 5 not in[1,2,3,4]结果为true |
(6)
运算符的优先级
当一个表达式中有多种运算时,运算的顺序是根据运算符的优先级由高到低进行运算。同级运算则按从左到右的顺序进行。
四、Python的函数
五、顺序结构
1.数据的输入
格式:<变量>=input(‘提示信息:’)
input( )函数的返回结果都是字符串,如果需要可将其转换为相应的类型再处理。
2.数据的输出
格式:print(object)
object是要输出的对象,可以是常量,变量或表达式
3.顺序结构的应用
顺序结构是最常用、最简单的程序结构,其语句执行顺序是自上而下依次执行的。
六、选择结构
1.单分支if语句
格式:if(条件表达式):
语句A
注意条件表达式后面有冒号,语句A要有缩进,语句A
如果是多个语句组成的复合语句时,所有语句严格遵循
相同的缩进。
2.双分支if语句
格式:if(条件表达式):
语句A
else:
语句B
注意:条件表达式后面有冒号,语句A要有缩进,语句A和语句B如果是多个语句组成的复合语句时,所有语句严格遵循相同的缩进。
3.多分支if...elif...else语句
格式:if(表达式1):
语句1
elif:(表达式2):
语句2
......
elif:(表达式N):
语句N
else:
语句N+1
七、循环结构
1. for循环语句
格式:for 循环变量 in 列表:
语句或语句组
(1)直接罗列的方式举例:
for value in [1,2,3,4,5]:
(2)使用range( )函数
range(start,stop,step)
计数从start开始(如果省略默认是0)
到stop结束(但不包括stop),
step表示步长,即间隔,(如果省略默认为1),step也可以是负数。
2. while循环语句
格式:while(表达式):
语句或语句组
while也叫当型循环,表达式是一个关系表达式或逻辑表达式,值为真(True)或假(False)whlie循环的循环体中必须有改变条件表达式值的语句,否则将成为死循环。
3.循环嵌套
循环嵌套指的是某一种循环语句中包含着自身或其他循环语句,for循环或while循环之间可以相互嵌套。
第五章 数据处理和可视化表达
一、认识大数据
(一)大数据的概念
大数据:无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
(二)大数据的特征
1.从互联网产生大数据的角度来看(具有“4V”特征):
ü 大量(Volume),多样(Variety)
ü 低价值密度(Value),高速(Velocity)。
2.从互联网思维的角度来看:
ü 样本渐趋于总体,精确让位于模糊,相关性重于因果
3.从大数据存储与计算的角度来看:
ü 分布式存储,分布式并行计算。
(二)大数据的影响
1.大数据使人们日常生活更为便捷:
ü 方便支付、方便出行、方便购物与产品推荐、方便看病与诊病。
2.大数据对人们日常生活产生的负面影响:
ü 个人信息泄露、信息伤害与诈骗。
二、数据的采集
(一)数据采集的方法与工具
1.系统日志采集法:
ü 监视系统中发生的事情
ü 检查错误发生的原因
ü 寻找攻击时攻击者留下的痕迹
2.网络数据采集法:
ü 网络爬虫:从初始网页的URL(统一资源定位器)获取对应的数据
ü 网络公开API
Python网络数据采集程序使用扩展库时导入模块的方法:
ü import module
ü from module import name
3.其他数据采集法。
(二)数据的存储
1.本地存储:把数据存在本地内部
2.云存储:把数据放在第三方公共或者私有的“云端”存储
ü 分布式文件存储
ü Nosql数据库存储
(三)数据的保护
1.数据安全保护技术:拷贝、备份、复制、镜像、持续备份,加密…
2.数据的隐私保护
(1)技术手段
ü 数据收集时:精度处理
ü 数据共享时:访问控制
ü 数据发布时:人工干扰
ü 数据分析时:匿名处理
(2)提高自身意识
(3)进行道德和法律约束
三、数据的分析
常见数据分析方法:特征探索,关联分析,聚类与分类,建立模型,模型评价
(一)特征探索
主要任务:对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。
(二)关联分析
1.概念:分析并发现存在于大数据之间的关联性或相关性,从而描述一个事物中某些属性同时出现的规律和模式。
2.常见应用案例:超市某些商品捆绑促销,新高考选修学科的选择。
(三)聚类分析
1.概念:一种探索性分析,不必事先给出分类标准,从样本数据出发,自动进行分类,进而达到“物以类聚,人以群分”的效果
2.常见的算法:k-means算法,自下而上的聚类分析方法
(四)数据分类
1.概念:基于样本数据先训练构建分类函数或分类模型(分类器)分类器将待分类数据映射到某一特点类别。
2.常见的分类技术:贝叶斯分类技术
四、数据的可视化表达
(一)数据可视化表达的方法
1.数据可视化的呈现类型
(1)探索类:帮助人们发现数据背后的价值
(2)解释类:简单明了地呈现数据
2.数据分析类型及对应的可视化呈现
(二)数据可视化表达的工具
1.Seaborn:主要关注统计模型的可视化,基于且高度依赖于Matplotlib.
2.Bokeh:能实现交互式可视化,独立于Matplotlib,能通过浏览器与数据驱动文档的风格呈现。
扩展库:
1.NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
2.Pandas 是 Python 语言的一个扩展程序库,用于数据分析。Pandas 名字衍生自术语 "panel data"(面板数据)和 "Python data analysis"(Python 数据分析)。Pandas 一个强大的分析结构化数据的工具集,基础是 Numpy(提供高性能的矩阵运算)。Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。Pandas 可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征。Pandas 广泛应用在学术、金融、统计学等各个数据分析领域。
3.Matplotlib 是 Python 的绘图库,它能让使用者很轻松地将数据图形化,并且提供多样化的输出格式。Matplotlib 可以用来绘制各种静态,动态,交互式的图表。Matplotlib 是一个非常强大的 Python 画图工具,我们可以使用该工具将很多数据通过图表的形式更直观的呈现出来。Matplotlib 可以绘制线图、散点图、等高线图、条形图、柱状图、3D 图形、甚至是图形动画等等。
4.Pyplot 是 Matplotlib 的子库,提供了和 MATLAB 类似的绘图 API。Pyplot 是常用的绘图模块,能很方便让用户绘制 2D 图表。
Pyplot的plot()函数,plot() 函数是绘制二维图形的最基本函数,可以绘制点和线;pyplot 中的 scatter() 方法来绘制散点图; pyplot 中的 bar() 方法来绘制柱形图; pyplot 中的 pie() 方法来绘制饼图
例:绘制正弦函数图像程序
import numpy as np #引入numpy库模块,用np替代
import matplotlib.pyplot as plt #引入matplotlib库模块中的pyplot方法,用plt替代
from pylab import * #引入pylab库模块中的所有方法
x = np.arange(-5.0, 5.0, 0.02) #定义x轴数值为-5到5,步长为0.02
y = np.sin(x) #利用正弦函数计算出x轴数值对应的y轴数值你
plt.plot(x, y) #利用x,y轴对应的数值绘制出图形
plt.show() #显示出绘制的图形
第六章 人工智能及其应用
一、认识人工智能
(一)人工智能的概念
人工智能:是计算机科学的一个分支,是研究计算机模拟人的某些感知能力、思维过程和智能行为(如学习,推理,思考、规划等)的学科。
(二)剖析领域知识智能问答机器人
1.概念:某一领域知识范围内实现人机自动问答的智能信息系统,是一种新颖的信息检索系统。
2.技术手段:自然语言处理技术
3.结构示意图
(1)常见问题解答模块:在FAQ库中寻找是否有用户问题
ü 主要技术:问句相似度计算和候选问句的选择
ü Jaccard相似度系数计算=交集/并集
(2)问题理解模块:理解用户问题,确定问题的关键字和问题类型
ü 主要技术:分词、同义词词典、分类方法
(3)信息检索模块:从互联网或文档库中找到与问题答案相关的材料
ü 主要技术:查询扩展、构建语料库、词汇索引、文档排序
(4)文档库模块:存放专家提供的知识
(5)答案抽取模块:根据问题类型构建答案抽取策略
ü 主要技术:制定答案抽取模板、模式匹配、聚类
(三)人工智能的诞生与发展
1.图灵测试:在测试者与被测试者隔开的情况下,通过一些装置向被测试者随意提问。经过多次测试后,如果被测试者超过70%的答复不能使测试者确认哪个是人,哪个是机器的回答,那这台机器被认为具有人类智能。
2.发展的阶段:
(1)第一阶段(20世纪50年代—80年代):符号主义快速发展
(2)第二阶段(20世纪80 年代—90年代末):低谷期
(3)第三阶段(21世纪初至今):繁荣时期
二、人工智能的应用
(一)智能制造
1.智能装备:自动识别设备、人机交互系统、工业机器人﹑数控机床。
2.智能工厂:智能设计、智能生产﹑智能管理以及集成优化。
3.智能服务:大规模个性化定制、远程维护以及预测性维护等。
(二)智能家居:智能冰箱、智能扫地机器人、指纹识别锁…
(三)智能教育:智能导师通过自然语言处理和语音识别技术,由计算机模拟教师教学的经验和方法,对学生实施一对一的教学,并向具有不同需求和特征的学习者传递知识。
(四)智能交通:ETC
(五)智能安防:利用人工智能对视频,图像进行存储和分析,从中识别安全隐患并对其进行处理的技术。
(六)智能医疗:主要在辅助诊疗,疾病预测,医疗影像辅助诊断,药物开发等方面发挥了重要作用。
1.生物特征识别技术:指纹识别、人脸识别、指静脉识别、声纹识别。
(七)智能物流:搬运机器人、分拣机器人、货架穿梭机…
(八)拓展:
1.深蓝:1997年,战胜世界象棋冠军
2.阿尔法狗:2016年,战胜世界围棋冠军。