人工智能导论
本笔记用于期末复习人工智能导论,水很多知识点
更新日记:
2025-05-03:第一次更新了绪论和第一章的内容
绪论内容(多为概念)
- 智能:知识和智力的总和,知识是一切智能行为的基础,而智力是运用获取的知识求解问题的能力
- 智能理论:包含思维理论、进化理论、知识阈值理论
- 思维理论:智能的核心是思维,智能来源于大脑的思维活动,着重于解释思维规律和方法
- 进化理论:人对环境和外界事物的刺激和感知能力,为智能发展提供了基础,是复杂系统多部件交互而产生的能力。
- 知识阈值理论:智能取决于知识的获取数量和其一般化、推广的程度
- 智能的特征
-
具有感知能力:通过各种感觉感知外部世界的能力
-
具有记忆和思维能力:对存储感知器官获取的信息,而思维则是用于对记忆的信息进行处理,其中思维分为逻辑思维、形象思维、顿悟思维。
区分特点:思维过程的串并行性质,以及线性和非线性的过程,逻辑为前者,而其余两个分别有后者的全部和部分性质。 -
具有学习能力:通过与环境的相互作用,自觉或不自觉地积累知识,达到学习的目的,存在监督和非监督的形式。
-
具有行为能力:对信息的输入有不同方面的信息输出,受到系统的控制。
-
人工智能的定义
人工智能就是要研究如何构造一个智能机器或者智能系统,能够模拟、延伸、拓展人类智能的学科。 -
人工智能研究的基本内容
- 知识表示
- 机器感知
- 机器思维
- 机器学习
- 机器行为
这五点对应了智能的特征。
知识表示
知识的特性
包括相对正确性(在某些条件、范畴下是正确的)、不确定性、可表示性与可利用性(知识能用适当的形式表示出来,并且可以被运用来解决问题),其中不确定性分为四种分别是:
- 随机性:不符合命题的非真即假的特点,即存在复杂情况的随机事件形成的知识。eg:如果A,则可能B 。
- 模糊性:客观的模糊性。eg:高个子
- 经验:专家得心应手却无法准确描述出来的知识。
- 不完全性:认识的不完全性,导致知识的表示本身存在一种不确定性。
一阶谓词逻辑表示
命题:不再赘述
谓词:包含谓词名P和个体(\(x, y, z\))等等
谓词的阶数:谓词的嵌套层数
区别谓词和函数:一个是表示个体的性质,另一个是表示个体之间的映射关系
谓词公式
连词:$ \daleth\wedge\vee\rightarrow\leftrightarrow $表示了其优先级
量词的使用:复习了离散数学相关的知识。
- 注意全总个体域和给定定义域描述对应谓词的区别,一般是给定全总个体域,需要设置另外的谓词来描述对应的属性。
谓词公式的性质
- 谓词公式的解释:对各命题都进行一次真值指派,根据连词和确定的命题来得出最后公式的真值。
- 永真性、可满足性、不可满足性:由定义可理解
- 计算性质不再赘述
谓词逻辑表示的优缺点
- 优点:自然(自然语言描述)、精确(二值逻辑)、严密(有各种推理规则支撑)、容易实现(由精确、严密、自然的性质自然可以推出)。
产生式表示法
- IF A THEN B (confidence)
产生式系统
包含推理机、规则库、综合数据库
其中推理机的工作包含:推理(规则库中选择并与综合数据库进行匹配)、冲突消解(从多个匹配成功的规则中选择正确的一个)、执行规则(右结论存入数据库、右操作继续执行)、检查推理结束条件(边界条件的检查)
框架表示法
- 框架名 -> 槽名 -> 侧面名 (侧面值)
知识图谱
- RDF和LPG两种表现方式,分别对应语义和图结构
- 模式层(结构化、模板、层次)和数据层(事实库)
- 自顶向下(定义好本体和数据模式然后将实体加入知识库)、自底向上(从数据中提取实体,将置信度较高的实体加入知识库最后构建本体模式)
确定性推理
推理方式及其分类
- 推出结论的途径
- 演绎推理:由一般性知识或假设(即全称判断推导单称判断)
- 归纳推理:由大量事例中归纳出一般性结论
- 默认推理:在知识不完全的情况下假设某些条件具备所进行的推理
- 推理所用知识的确定性:确定性和不确定性
- 推理推出结论是否一直越来越接近最终目标
- 单调推理:单调不回溯
- 非单调推理:随着新知识的加入,不仅没有加强已得出的结论,而且要否定并回溯重新开始。
- 推理方向:分为正向推理、逆向推理、混合推理、双向推理:
- 正向:根据已知事实得到问题解
- 逆向:根据假设的事实从知识库寻找能推出该假设的已知的事实,并设定新的假设目标
- 混合推理:正逆向有先后顺序的推理,先正后逆、先逆后正
- 双向推理:碰头推理
冲突消解策略
即已知事实能与知识库中多个知识匹配成功,或者多个事实能与知识库中的一个知识匹配成功或者多对多。
消解策略排序:
- 规则针对性:即规则包含关系,优先用除包含条件外还存在其他条件的规则。
- 事实的新鲜性:事实生成的先后顺序:逐个比较计数、最大和最大、最小和最小比。
- 匹配度:不确定性推理中计算事实和知识的匹配度。
- 条件个数:在生成结论相同的情况下,优先使用应用条件少的产生式规则。
谓词公式化子句集
子句:任何文字的析取式称为子句,子句的集合称为子句集。
存在量词的消去:
一种是存在量词不出现在全称量词的辖域内,可直接用常量替换,另一种是存在量词出现在一个或者多个全称量词的辖域内。
Skolem函数:对于\((\forall x_1)(\forall x_2)(\forall x_3)(\exists y)P(x_1, x_2, x_3, x_n, y)\)
其量词\(y\)的Skolem函数为:\(y = f(x_1, x_2, x_3, ...,x_n)\)
定理:谓词公式不可满足的充要条件是其子句集不可满足。
不确定性推理
可信度方法
- IF E THEN H (CF(H,E))
- CF(H) = CF(H, E) * max
- 合成不再赘述
证据理论
概率分配函数
设函数\(M:2^D\to \left [0,1 \right ]\),对于每一个属于D的子集A,都存在一个概率分配,且所有的概率相加得1,并且子集的子集不存在这种关系。
信任函数
\(M:2^D\to \left [0,1 \right ]\),存在\(Bel(A)=\sum\limits_{B\subseteq A}M(B)\, \, \, \, \forall A \subseteq D\),即某集合的信任函数,是其非空子集的概率分配函数之和,即对A为真的信任程度。
似然函数
\(Pl:2^D\to \left [0,1 \right ]\),且\(Pl(A) = 1 - Bel(\neg A)\, \, \, \, \forall A \subseteq D\),即对A为假的信任程度。
计算正交和
\(K=1-\sum\limits_{X\cap Y = \emptyset}M_1(X)M_2(Y)\)
\(M(A)=K^{-1}\sum\limits_{X\cap Y=A}M_1(X)M_2(Y)\)且\(M(\emptyset)=0\)
模糊集合
表示:\(A=\left \{ (x, \mu_A(x), \, \, x \in X ) \right \}\)即元素和其对应的隶属度。
方式:\(A=\mu_A(x_1)/x_1\)和\(A=\int\limits_{x \, \in \, U} \mu_A(x)/x\)和序偶表示法(/变成逗号)和向量表示法(元素包含在隶属度中)
合成公式:一般按照叉积最小算子运算即$\mu_{A\times B}(a, b) = min \left {\mu_A(a), \mu B(b) \right } \(
\)\mu_{A\times B}(a, b)=\mu^T_A \circ \mu_B$
关系合成方法:最大-最小合成、最大-代数积合成
模糊决策
- 取最大隶属度对应的向量:
- 取加权平均判决:
- 中位数法:离散点存在\(\sum\limits^{u^*}_{u_1}\mu(u_i) = \sum \limits^{u^n}_{u^*+1}\mu(u_j)\)
搜索求解策略
智能计算及其应用
遗传算法
本次内容按照遗传算法的步骤进行对基础的遗传算法总结,以达到复习基础操作的目的
1. 初始化种群:
包含了前置内容:编码、适应度函数的编写以及实际操作内容:种群群体的产生确定、选择操作。
编码部分:
- 二进制编码:将原问题的解空间映射到$B\left { 0,1 \right } \(的一个过程,例如在求解某目标函数\)y = f(x)$的最优解时,给定了自变量范围以及最后解的精度,可根据数的多少确定一个二进制编码的范围。
缺点:高维问题搜索效率低下,相邻的整数汉明距离大、以及上文根据解精度确定编码也会导致微调缺乏的问题。 - \(Gray\)编码:对\(B\)编码进行变换,具体映射形式为:
其中\(\oplus\)代表模2加法,对应的逆变换为:
- 实数编码:不进行数制转换,有利于利用启发式信息以及解决高维、复数域的问题。
- 多参数级联编码:将多个参数进行二进制编码形成子串,子串连接可以得到一个拥有不同长度、不同取值子串(参数)的一个完整串信息。
群体产生确定:
- 根据解空间内最优解的分布设置初始群体,随机生成并挑选最好个体加入初始群体,直到达到一个目标值。
- 规模确定:一般取\(20-100\),容易陷入局部最优解和计算复杂度大的折中,原因:应该是有人算过。
适应度函数:
反映了群体中个体的好坏指标。
- 简单粗暴:直接将目标函数作为适应度函数。
- 解决欺骗问题:妨碍适应度高的个体产生的问题,通常表现为过早收敛和后期的竞争停滞,提出了尺度变换解决原始适应度值比例不均的问题。
线性变换
参数a, b的设定满足:1.变换后适应度平均值等于变换前平均值,该行为目的:保证平均值处的期望复制个数为\(1\,\)。2. 变换后适应度函数最大值等于原适应度函数平均值的指定倍数\(C_{mult}\,\),以控制适应度最大的个体在下一代的复制数。
解得参数(一般):
非线性变换
不再赘述
2. 按适应度选择种群:
复制操作:
包含概率分配和选择方法
-
比例分配:直接按适应度大小计算在和内比例(异号情况不适用)
-
排序分配:按照大小排序,保留了比例特征
线性:$$p_i = \frac{a-b i}{M(M+1)}$$
该式中分配常数a,b即可
非线性:例如下式
-
轮盘赌:根据选择概率确定轮盘分布,产生随机数并指定两个选到的个体交叉。
-
锦标赛选择:随机选择\(k\)个个体将适应度最高的个体保存到下一代,反复执行直到道达到预设。
-
最佳个体保存:即复制该代适应度最高的个体到下一代
交叉变异:
- 单点交叉、多点交叉:选定\(k\)个点在区间内交换。
- 修正交叉:分为部分匹配交叉PMX、顺序交叉OX。
解释:部分匹配交叉即两点交叉后,区间外与区间内重复的部分通过区间内两点内的一一对应关系(若对应的部分在区间外不存在)把其他的位置重复的调换(替换非法解),顺序交叉即将两点内交换后,对交换后区间外的部分进行排序,并去除区间内的部分直接按顺序填入即可。(直接生成合法解) - 位点(分二进制和整数(概率选择,为消除非法性可将被选中的基因改为被选中的基因:)))、逆转、插入、互换(随机选取两个基因互换)
流程图见教材即可:即编码问题、初始化种群、计算适应度值、分析是否到达终止节点、分别输出最优解或根据适应度变异交叉。
粒子群优化算法
- 公式:
其中 $\left [ 0,a_1 \right ] , \left [ 0,a_2 \right ] $ 为满足均匀分布的随机数,\(\varphi_1, \varphi_2\) 为非负的加速度常数,分别代表个体和群体的学习率,\(\omega\)为惯性权重,代表了粒子群的探索力。根据公式和预设误差逐步迭代即可。
- 注意速度每维度设置边界最大速度\(V_max\),过高可能错过好的解,过低容易陷入局部过快最优。
实例:计算函数最大最小值等(暂未拓展)
蚁群算法
TSP中的应用:计算某时刻蚂蚁选择从\(i\)到\(j\)的概率
公式:
- \(\tau_{ij}\):路径 \(i \to j\) 的信息素浓度
- \(\eta_{ij} = 1 / d_{ij}\):路径的启发函数
- \(\alpha\):控制信息素重要程度
- \(\beta\):控制启发信息重要程度
- \(allowed_k(x) = \left \{ 1,..., n \right \} -tabu_k(x)\):在全集中减去走过的城市表示合法的城市。
其中\(\delta\tau^k_{xy}(t)\)一般为所走路径长度相关\(\frac{Q}{L_k}\)
专家系统
本章主要复习专家系统的一般结构以及各个结构的工作过程、以及部分机器学习的宽泛概念,学习使用构成专家系统的库。
一般包含人机接口、解释机构、知识获取机构、综合数据库、知识库、推理机六部分。
- 知识库:包含了合适的知识表示方法表达出来的知识,以及对应的知识库管理系统(组织、检索、维护、安全防护)
- 推理机:根据已知事实以及知识库中的知识,按照一定的推理方法(确定性和不确定性推理)和控制策略(包含推理方向:正反以及混合、以及搜索策略等)推理得出结论。(见第三章概念)
- 综合数据库:用户提供的初始化事实,随着推理产生的中间结果以及相应的管理系统。与知识库的区别是运行过程中会发生变化而不是只能在接口处输入。
- 知识获取机构:获取知识并把知识转化成可存储形式并存入知识库。
- 人机接口:专家系统与用户等交互的界面,包含一系列程序和硬件,用于完成输入输出。
- 解释机构:回答用户提出的问题,解释推理过程。
知识获取
包含抽取、转换(形式转换)、输入(编辑编译输入知识库)、检测(每个环节应都需要)
- 知识获取的三种模式:自动、半自动、非自动。
`