人工智能导论

本笔记用于期末复习人工智能导论，水很多知识点

更新日记：
2025-05-03：第一次更新了绪论和第一章的内容

绪论内容（多为概念）

智能：知识和智力的总和，知识是一切智能行为的基础，而智力是运用获取的知识求解问题的能力
智能理论：包含思维理论、进化理论、知识阈值理论

思维理论：智能的核心是思维,智能来源于大脑的思维活动，着重于解释思维规律和方法
进化理论：人对环境和外界事物的刺激和感知能力，为智能发展提供了基础，是复杂系统多部件交互而产生的能力。
知识阈值理论：智能取决于知识的获取数量和其一般化、推广的程度

智能的特征

具有感知能力：通过各种感觉感知外部世界的能力
具有记忆和思维能力：对存储感知器官获取的信息，而思维则是用于对记忆的信息进行处理，其中思维分为逻辑思维、形象思维、顿悟思维。
区分特点：思维过程的串并行性质，以及线性和非线性的过程，逻辑为前者，而其余两个分别有后者的全部和部分性质。
具有学习能力：通过与环境的相互作用，自觉或不自觉地积累知识，达到学习的目的，存在监督和非监督的形式。
具有行为能力：对信息的输入有不同方面的信息输出，受到系统的控制。

人工智能的定义
人工智能就是要研究如何构造一个智能机器或者智能系统，能够模拟、延伸、拓展人类智能的学科。
衡量机器智能（即人工智能）的准则：图灵测试
人工智能研究的基本内容

知识表示
机器感知
机器思维
机器学习
机器行为

这五点对应了智能的特征。

知识表示

知识的特性

包括相对正确性（在某些条件、范畴下是正确的）、不确定性、可表示性与可利用性（知识能用适当的形式表示出来，并且可以被运用来解决问题），其中不确定性分为四种分别是：

随机性：不符合命题的非真即假的特点，即存在复杂情况的随机事件形成的知识。eg:如果A，则可能B 。
模糊性：客观的模糊性。eg:高个子
经验：专家得心应手却无法准确描述出来的知识。
不完全性：认识的不完全性，导致知识的表示本身存在一种不确定性。

一阶谓词逻辑表示

命题：不再赘述
谓词：包含谓词名P和个体($x, y, z$)等等
谓词的阶数：谓词的嵌套层数
区别谓词和函数：一个是表示个体的性质，另一个是表示个体之间的映射关系

谓词公式

连词：$ \daleth\wedge\vee\rightarrow\leftrightarrow $表示了其优先级

量词的使用：复习了离散数学相关的知识。

注意全总个体域和给定定义域描述对应谓词的区别，一般是给定全总个体域，需要设置另外的谓词来描述对应的属性。

谓词公式的性质

谓词公式的解释：对各命题都进行一次真值指派，根据连词和确定的命题来得出最后公式的真值。
永真性、可满足性、不可满足性：由定义可理解
计算性质不再赘述

谓词逻辑表示的优缺点

优点：自然（自然语言描述）、精确（二值逻辑）、严密（有各种推理规则支撑）、容易实现（由精确、严密、自然的性质自然可以推出）。

产生式表示法

IF A THEN B (confidence)

产生式系统

包含推理机、规则库、综合数据库
其中推理机的工作包含：推理（规则库中选择并与综合数据库进行匹配）、冲突消解（从多个匹配成功的规则中选择正确的一个）、执行规则（右结论存入数据库、右操作继续执行）、检查推理结束条件（边界条件的检查）

框架表示法

框架名 -> 槽名 -> 侧面名 (侧面值)

知识图谱

RDF和LPG两种表现方式,分别对应语义和图结构
模式层（结构化、模板、层次）和数据层（事实库）
自顶向下（定义好本体和数据模式然后将实体加入知识库）、自底向上（从数据中提取实体，将置信度较高的实体加入知识库最后构建本体模式）

确定性推理

推理方式及其分类

推出结论的途径
- 演绎推理:由一般性知识或假设（即全称判断推导单称判断）
- 归纳推理：由大量事例中归纳出一般性结论
- 默认推理:在知识不完全的情况下假设某些条件具备所进行的推理
推理所用知识的确定性：确定性和不确定性
推理推出结论是否一直越来越接近最终目标
- 单调推理:单调不回溯
- 非单调推理:随着新知识的加入，不仅没有加强已得出的结论，而且要否定并回溯重新开始。
推理方向:分为正向推理、逆向推理、混合推理、双向推理：
- 正向：根据已知事实得到问题解
- 逆向：根据假设的事实从知识库寻找能推出该假设的已知的事实，并设定新的假设目标
- 混合推理：正逆向有先后顺序的推理，先正后逆、先逆后正
- 双向推理：碰头推理

冲突消解策略

即已知事实能与知识库中多个知识匹配成功，或者多个事实能与知识库中的一个知识匹配成功或者多对多。
消解策略排序:

规则针对性：即规则包含关系，优先用除包含条件外还存在其他条件的规则。
事实的新鲜性：事实生成的先后顺序：逐个比较计数、最大和最大、最小和最小比。
匹配度：不确定性推理中计算事实和知识的匹配度。
条件个数：在生成结论相同的情况下，优先使用应用条件少的产生式规则。

谓词公式化子句集

子句：任何文字的析取式称为子句，子句的集合称为子句集。
存在量词的消去：
一种是存在量词不出现在全称量词的辖域内，可直接用常量替换，另一种是存在量词出现在一个或者多个全称量词的辖域内。
Skolem函数：对于$(\forall x_1)(\forall x_2)(\forall x_3)(\exists y)P(x_1, x_2, x_3, x_n, y)$

其量词$y$的Skolem函数为：$y = f(x_1, x_2, x_3, ...,x_n)$
定理：谓词公式不可满足的充要条件是其子句集不可满足。

不确定性推理

可信度方法

IF E THEN H (CF(H,E))
CF(H) = CF(H, E) * max
合成不再赘述

证据理论

概率分配函数

设函数$M:2^D\to \left [0,1 \right ]$，对于每一个属于D的子集A，都存在一个概率分配，且所有的概率相加得1，并且子集的子集不存在这种关系。

信任函数

$M:2^D\to \left [0,1 \right ]$，存在$Bel(A)=\sum\limits_{B\subseteq A}M(B)\, \, \, \, \forall A \subseteq D$，即某集合的信任函数，是其非空子集的概率分配函数之和，即对A为真的信任程度。

似然函数

$Pl:2^D\to \left [0,1 \right ]$，且$Pl(A) = 1 - Bel(\neg A)\, \, \, \, \forall A \subseteq D$，即对A为假的信任程度。

计算正交和

$K=1-\sum\limits_{X\cap Y = \emptyset}M_1(X)M_2(Y)$
$M(A)=K^{-1}\sum\limits_{X\cap Y=A}M_1(X)M_2(Y)$且$M(\emptyset)=0$

模糊集合

表示：$A=\left \{ (x, \mu_A(x), \, \, x \in X ) \right \}$即元素和其对应的隶属度。
方式：$A=\mu_A(x_1)/x_1$和$A=\int\limits_{x \, \in \, U} \mu_A(x)/x$和序偶表示法（/变成逗号）和向量表示法（元素包含在隶属度中）
合成公式：一般按照叉积最小算子运算即$\mu_{A\times B}(a, b) = min \left {\mu_A(a), \mu B(b) \right } \mu_{A\times B}(a, b)=\mu^T_A \circ \mu_B$
关系合成方法：最大-最小合成、最大-代数积合成

模糊决策

取最大隶属度对应的向量：
取加权平均判决：
中位数法:离散点存在$\sum\limits^{u^*}_{u_1}\mu(u_i) = \sum \limits^{u^n}_{u^*+1}\mu(u_j)$

搜索求解策略

智能计算及其应用

遗传算法

本次内容按照遗传算法的步骤进行对基础的遗传算法总结，以达到复习基础操作的目的

1. 初始化种群：

包含了前置内容：编码、适应度函数的编写以及实际操作内容：种群群体的产生确定、选择操作。

编码部分：

二进制编码：将原问题的解空间映射到$B\left { 0,1 \right } $的一个过程，例如在求解某目标函数$y = f(x)$的最优解时，给定了自变量范围以及最后解的精度，可根据数的多少确定一个二进制编码的范围。
缺点:高维问题搜索效率低下，相邻的整数汉明距离大、以及上文根据解精度确定编码也会导致微调缺乏的问题。
$Gray$编码：对$B$编码进行变换，具体映射形式为：

\[\gamma_k=\left\{\begin{array}{cl}\beta_1 & k=1, \\ \beta_{k-1} \oplus \beta_k & k>1\end{array}\right. \]

其中$\oplus$代表模2加法，对应的逆变换为：

\[\beta_k=\sum_{i=1}^{k}{\gamma_{i}(\text{mod}\,{2})}\left\{\begin{array}{cl}\gamma_1 & k=1, \\ \beta_{k-1} \oplus \gamma_k & k>1\end{array}\right. \]

实数编码：不进行数制转换，有利于利用启发式信息以及解决高维、复数域的问题。
多参数级联编码：将多个参数进行二进制编码形成子串，子串连接可以得到一个拥有不同长度、不同取值子串（参数）的一个完整串信息。

群体产生确定：

根据解空间内最优解的分布设置初始群体，随机生成并挑选最好个体加入初始群体，直到达到一个目标值。
规模确定：一般取$20-100$，容易陷入局部最优解和计算复杂度大的折中，原因：应该是有人算过。

适应度函数：
反映了群体中个体的好坏指标。

简单粗暴：直接将目标函数作为适应度函数。
解决欺骗问题：妨碍适应度高的个体产生的问题，通常表现为过早收敛和后期的竞争停滞，提出了尺度变换解决原始适应度值比例不均的问题。
线性变换

\[f^{'} = af + b \]

参数a, b的设定满足：1.变换后适应度平均值等于变换前平均值，该行为目的：保证平均值处的期望复制个数为$1\,$。2. 变换后适应度函数最大值等于原适应度函数平均值的指定倍数$C_{mult}\,$，以控制适应度最大的个体在下一代的复制数。
解得参数（一般）：

\[a=\frac{f^{'}_{max}-f_{avg}}{f_{max}-f_{avg}} \]

\[\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;b=\frac{(f_{max}-f_{max}^{'})f_{avg}}{f_{max}-f_{avg}} \]

非线性变换
不再赘述

2. 按适应度选择种群：

复制操作：
包含概率分配和选择方法

比例分配：直接按适应度大小计算在和内比例（异号情况不适用）
排序分配：按照大小排序，保留了比例特征
线性：$$p_i = \frac{a-b i}{M(M+1)}$$
该式中分配常数a，b即可
非线性：例如下式

\[p_i = \left\{\begin{array}{cl}q(1-q)^{i-1} & i=1, 2,..., M-1 \\ (1-q)^{M-1} & i=M\end{array}\right. \]

轮盘赌：根据选择概率确定轮盘分布，产生随机数并指定两个选到的个体交叉。
锦标赛选择：随机选择$k$个个体将适应度最高的个体保存到下一代，反复执行直到道达到预设。
最佳个体保存：即复制该代适应度最高的个体到下一代

交叉变异：

单点交叉、多点交叉：选定$k$个点在区间内交换。
修正交叉：分为部分匹配交叉PMX、顺序交叉OX。
解释：部分匹配交叉即两点交叉后，区间外与区间内重复的部分通过区间内两点内的一一对应关系（若对应的部分在区间外不存在）把其他的位置重复的调换(替换非法解)，顺序交叉即将两点内交换后，对交换后区间外的部分进行排序，并去除区间内的部分直接按顺序填入即可。（直接生成合法解）
位点（分二进制和整数（概率选择，为消除非法性可将被选中的基因改为被选中的基因：）））、逆转、插入、互换（随机选取两个基因互换）

流程图见教材即可：即编码问题、初始化种群、计算适应度值、分析是否到达终止节点、分别输出最优解或根据适应度变异交叉。

粒子群优化算法

公式：

\[v^i_j(k+1)=\omega(k)v^i_j(k) + \varphi_1 rand(0, a_1)(p^i_j(k)- x^i_j(k))+\varphi_2 rand(0, a_2)(p^g_j(k)- x^i_j(k)) \]

\[x^i_j(k + 1)=x^i_j(k)+v^i_j(k+1) \]

其中 $\left [ 0,a_1 \right ] , \left [ 0,a_2 \right ] $ 为满足均匀分布的随机数，$\varphi_1, \varphi_2$ 为非负的加速度常数,分别代表个体和群体的学习率，$\omega$为惯性权重，代表了粒子群的探索力。根据公式和预设误差逐步迭代即可。

注意速度每维度设置边界最大速度$V_max$，过高可能错过好的解，过低容易陷入局部过快最优。
实例：计算函数最大最小值等（暂未拓展）

蚁群算法

TSP中的应用:计算某时刻蚂蚁选择从$i$到$j$的概率
公式：

$\tau_{ij}$：路径 $i \to j$ 的信息素浓度
$\eta_{ij} = 1 / d_{ij}$：路径的启发函数
$\alpha$：控制信息素重要程度
$\beta$：控制启发信息重要程度
$allowed_k(x) = \left \{ 1,..., n \right \} -tabu_k(x)$：在全集中减去走过的城市表示合法的城市。

\[P^k_{xy}(t)=\left\{\begin{array}{cl}\frac{\left [ \tau_{xy}(t) \right ]^\alpha \left [ \eta _{xy} \right ]^\beta}{\sum\limits_{y\in allowed_k(x)} {\left [ \tau_{xy}(t) \right ]^\alpha \left [ \eta _{xy} \right ]^\beta}} & if \,\,\,\,\,\,y\in allowed_{k}(x), \\ 0 & other\end{array}\right. \]

\[\tau_{xy}(t+1)=\rho(\rho \in \left [0,1 \right ])*\tau{xy}(t)+\delta\tau_{xy}(t) \]

\[\tau_{xy}(t)=\sum\limits^{m}_{k=1}\delta\tau^k_{xy}(t) \]

其中$\delta\tau^k_{xy}(t)$一般为所走路径长度相关$\frac{Q}{L_k}$

专家系统

本章主要复习专家系统的一般结构以及各个结构的工作过程、以及部分机器学习的宽泛概念，学习使用构成专家系统的库。
一般包含人机接口、解释机构、知识获取机构、综合数据库、知识库、推理机六部分。

知识库：包含了合适的知识表示方法表达出来的知识，以及对应的知识库管理系统（组织、检索、维护、安全防护）
推理机：根据已知事实以及知识库中的知识，按照一定的推理方法（确定性和不确定性推理）和控制策略(包含推理方向：正反以及混合、以及搜索策略等)推理得出结论。(见第三章概念)
综合数据库：用户提供的初始化事实，随着推理产生的中间结果以及相应的管理系统。与知识库的区别是运行过程中会发生变化而不是只能在接口处输入。
知识获取机构：获取知识并把知识转化成可存储形式并存入知识库。
人机接口：专家系统与用户等交互的界面，包含一系列程序和硬件，用于完成输入输出。
解释机构：回答用户提出的问题，解释推理过程。

知识获取

包含抽取、转换（形式转换）、输入(编辑编译输入知识库)、检测（每个环节应都需要）

知识获取的三种模式：自动、半自动、非自动。
`

posted @ 2025-05-04 12:10 Clematis068 阅读(263) 评论(0) 收藏举报

刷新页面返回顶部

Clematis068