人工智能导论

本笔记用于期末复习人工智能导论,水很多知识点

更新日记:
2025-05-03:第一次更新了绪论和第一章的内容

绪论内容(多为概念)

  • 智能:知识和智力的总和,知识是一切智能行为的基础,而智力是运用获取的知识求解问题的能力
  • 智能理论:包含思维理论、进化理论、知识阈值理论
  1. 思维理论:智能的核心是思维,智能来源于大脑的思维活动,着重于解释思维规律和方法
  2. 进化理论:人对环境和外界事物的刺激和感知能力,为智能发展提供了基础,是复杂系统多部件交互而产生的能力。
  3. 知识阈值理论:智能取决于知识的获取数量和其一般化、推广的程度
  • 智能的特征
  1. 具有感知能力:通过各种感觉感知外部世界的能力

  2. 具有记忆和思维能力:对存储感知器官获取的信息,而思维则是用于对记忆的信息进行处理,其中思维分为逻辑思维、形象思维、顿悟思维。
    区分特点:思维过程的串并行性质,以及线性和非线性的过程,逻辑为前者,而其余两个分别有后者的全部和部分性质。

  3. 具有学习能力:通过与环境的相互作用,自觉或不自觉地积累知识,达到学习的目的,存在监督和非监督的形式。

  4. 具有行为能力:对信息的输入有不同方面的信息输出,受到系统的控制。

  • 人工智能的定义
    人工智能就是要研究如何构造一个智能机器或者智能系统,能够模拟、延伸、拓展人类智能的学科。

  • 人工智能研究的基本内容

  1. 知识表示
  2. 机器感知
  3. 机器思维
  4. 机器学习
  5. 机器行为

这五点对应了智能的特征。

知识表示

知识的特性

包括相对正确性(在某些条件、范畴下是正确的)、不确定性、可表示性与可利用性(知识能用适当的形式表示出来,并且可以被运用来解决问题),其中不确定性分为四种分别是:

  1. 随机性:不符合命题的非真即假的特点,即存在复杂情况的随机事件形成的知识。eg:如果A,则可能B 。
  2. 模糊性:客观的模糊性。eg:高个子
  3. 经验:专家得心应手却无法准确描述出来的知识。
  4. 不完全性:认识的不完全性,导致知识的表示本身存在一种不确定性。
一阶谓词逻辑表示

命题:不再赘述
谓词:包含谓词名P和个体(\(x, y, z\))等等
谓词的阶数:谓词的嵌套层数
区别谓词和函数:一个是表示个体的性质,另一个是表示个体之间的映射关系

谓词公式

连词:$ \daleth\wedge\vee\rightarrow\leftrightarrow $表示了其优先级

量词的使用:复习了离散数学相关的知识。
  • 注意全总个体域和给定定义域描述对应谓词的区别,一般是给定全总个体域,需要设置另外的谓词来描述对应的属性。
谓词公式的性质
  • 谓词公式的解释:对各命题都进行一次真值指派,根据连词和确定的命题来得出最后公式的真值。
  • 永真性、可满足性、不可满足性:由定义可理解
  • 计算性质不再赘述
谓词逻辑表示的优缺点
  • 优点:自然(自然语言描述)、精确(二值逻辑)、严密(有各种推理规则支撑)、容易实现(由精确、严密、自然的性质自然可以推出)。
产生式表示法
  • IF A THEN B (confidence)
产生式系统

包含推理机、规则库、综合数据库
其中推理机的工作包含:推理(规则库中选择并与综合数据库进行匹配)、冲突消解(从多个匹配成功的规则中选择正确的一个)、执行规则(右结论存入数据库、右操作继续执行)、检查推理结束条件(边界条件的检查)

框架表示法
  • 框架名 -> 槽名 -> 侧面名 (侧面值)
知识图谱
  • RDF和LPG两种表现方式,分别对应语义和图结构
  • 模式层(结构化、模板、层次)和数据层(事实库)
  • 自顶向下(定义好本体和数据模式然后将实体加入知识库)、自底向上(从数据中提取实体,将置信度较高的实体加入知识库最后构建本体模式)

确定性推理

推理方式及其分类
  1. 推出结论的途径
    • 演绎推理:由一般性知识或假设(即全称判断推导单称判断)
    • 归纳推理:由大量事例中归纳出一般性结论
    • 默认推理:在知识不完全的情况下假设某些条件具备所进行的推理
  2. 推理所用知识的确定性:确定性和不确定性
  3. 推理推出结论是否一直越来越接近最终目标
    • 单调推理:单调不回溯
    • 非单调推理:随着新知识的加入,不仅没有加强已得出的结论,而且要否定并回溯重新开始。
  4. 推理方向:分为正向推理、逆向推理、混合推理、双向推理:
    • 正向:根据已知事实得到问题解
    • 逆向:根据假设的事实从知识库寻找能推出该假设的已知的事实,并设定新的假设目标
    • 混合推理:正逆向有先后顺序的推理,先正后逆、先逆后正
    • 双向推理:碰头推理
冲突消解策略

即已知事实能与知识库中多个知识匹配成功,或者多个事实能与知识库中的一个知识匹配成功或者多对多。
消解策略排序:

  • 规则针对性:即规则包含关系,优先用除包含条件外还存在其他条件的规则。
  • 事实的新鲜性:事实生成的先后顺序:逐个比较计数、最大和最大、最小和最小比。
  • 匹配度:不确定性推理中计算事实和知识的匹配度。
  • 条件个数:在生成结论相同的情况下,优先使用应用条件少的产生式规则。
谓词公式化子句集

子句:任何文字的析取式称为子句,子句的集合称为子句集。
存在量词的消去
一种是存在量词不出现在全称量词的辖域内,可直接用常量替换,另一种是存在量词出现在一个或者多个全称量词的辖域内。
Skolem函数:对于\((\forall x_1)(\forall x_2)(\forall x_3)(\exists y)P(x_1, x_2, x_3, x_n, y)\)

其量词\(y\)Skolem函数为:\(y = f(x_1, x_2, x_3, ...,x_n)\)
定理:谓词公式不可满足的充要条件是其子句集不可满足。

不确定性推理

可信度方法
  • IF E THEN H (CF(H,E))
  • CF(H) = CF(H, E) * max
  • 合成不再赘述
证据理论
概率分配函数

设函数\(M:2^D\to \left [0,1 \right ]\),对于每一个属于D的子集A,都存在一个概率分配,且所有的概率相加得1,并且子集的子集不存在这种关系。

信任函数

\(M:2^D\to \left [0,1 \right ]\),存在\(Bel(A)=\sum\limits_{B\subseteq A}M(B)\, \, \, \, \forall A \subseteq D\),即某集合的信任函数,是其非空子集的概率分配函数之和,即对A为真的信任程度。

似然函数

\(Pl:2^D\to \left [0,1 \right ]\),且\(Pl(A) = 1 - Bel(\neg A)\, \, \, \, \forall A \subseteq D\),即对A为假的信任程度。

计算正交和

\(K=1-\sum\limits_{X\cap Y = \emptyset}M_1(X)M_2(Y)\)
\(M(A)=K^{-1}\sum\limits_{X\cap Y=A}M_1(X)M_2(Y)\)\(M(\emptyset)=0\)

模糊集合

表示:\(A=\left \{ (x, \mu_A(x), \, \, x \in X ) \right \}\)即元素和其对应的隶属度。
方式:\(A=\mu_A(x_1)/x_1\)\(A=\int\limits_{x \, \in \, U} \mu_A(x)/x\)和序偶表示法(/变成逗号)和向量表示法(元素包含在隶属度中)
合成公式:一般按照叉积最小算子运算即$\mu_{A\times B}(a, b) = min \left {\mu_A(a), \mu B(b) \right } \( \)\mu_{A\times B}(a, b)=\mu^T_A \circ \mu_B$
关系合成方法:最大-最小合成、最大-代数积合成

模糊决策
  1. 取最大隶属度对应的向量:
  2. 取加权平均判决:
  3. 中位数法:离散点存在\(\sum\limits^{u^*}_{u_1}\mu(u_i) = \sum \limits^{u^n}_{u^*+1}\mu(u_j)\)

搜索求解策略

智能计算及其应用

遗传算法

本次内容按照遗传算法的步骤进行对基础的遗传算法总结,以达到复习基础操作的目的

1. 初始化种群:

包含了前置内容:编码、适应度函数的编写以及实际操作内容:种群群体的产生确定、选择操作。

编码部分:

  • 二进制编码:将原问题的解空间映射到$B\left { 0,1 \right } \(的一个过程,例如在求解某目标函数\)y = f(x)$的最优解时,给定了自变量范围以及最后解的精度,可根据数的多少确定一个二进制编码的范围。
    缺点:高维问题搜索效率低下,相邻的整数汉明距离大、以及上文根据解精度确定编码也会导致微调缺乏的问题。
  • \(Gray\)编码:对\(B\)编码进行变换,具体映射形式为:

\[\gamma_k=\left\{\begin{array}{cl}\beta_1 & k=1, \\ \beta_{k-1} \oplus \beta_k & k>1\end{array}\right. \]

其中\(\oplus\)代表模2加法,对应的逆变换为:

\[\beta_k=\sum_{i=1}^{k}{\gamma_{i}(\text{mod}\,{2})}\left\{\begin{array}{cl}\gamma_1 & k=1, \\ \beta_{k-1} \oplus \gamma_k & k>1\end{array}\right. \]

  • 实数编码:不进行数制转换,有利于利用启发式信息以及解决高维、复数域的问题。
  • 多参数级联编码:将多个参数进行二进制编码形成子串,子串连接可以得到一个拥有不同长度、不同取值子串(参数)的一个完整串信息。

群体产生确定:

  • 根据解空间内最优解的分布设置初始群体,随机生成并挑选最好个体加入初始群体,直到达到一个目标值。
  • 规模确定:一般取\(20-100\),容易陷入局部最优解和计算复杂度大的折中,原因:应该是有人算过。

适应度函数:
反映了群体中个体的好坏指标。

  • 简单粗暴:直接将目标函数作为适应度函数。
  • 解决欺骗问题:妨碍适应度高的个体产生的问题,通常表现为过早收敛和后期的竞争停滞,提出了尺度变换解决原始适应度值比例不均的问题。
    线性变换

\[f^{'} = af + b \]

参数a, b的设定满足:1.变换后适应度平均值等于变换前平均值,该行为目的:保证平均值处的期望复制个数为\(1\,\)。2. 变换后适应度函数最大值等于原适应度函数平均值的指定倍数\(C_{mult}\,\),以控制适应度最大的个体在下一代的复制数。
解得参数(一般):

\[a=\frac{f^{'}_{max}-f_{avg}}{f_{max}-f_{avg}} \]

\[\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;b=\frac{(f_{max}-f_{max}^{'})f_{avg}}{f_{max}-f_{avg}} \]

非线性变换
不再赘述

2. 按适应度选择种群:

复制操作:
包含概率分配和选择方法

  • 比例分配:直接按适应度大小计算在和内比例(异号情况不适用)

  • 排序分配:按照大小排序,保留了比例特征
    线性:$$p_i = \frac{a-b i}{M(M+1)}$$
    该式中分配常数a,b即可
    非线性:例如下式

\[p_i = \left\{\begin{array}{cl}q(1-q)^{i-1} & i=1, 2,..., M-1 \\ (1-q)^{M-1} & i=M\end{array}\right. \]

  • 轮盘赌:根据选择概率确定轮盘分布,产生随机数并指定两个选到的个体交叉。

  • 锦标赛选择:随机选择\(k\)个个体将适应度最高的个体保存到下一代,反复执行直到道达到预设。

  • 最佳个体保存:即复制该代适应度最高的个体到下一代

交叉变异:

  • 单点交叉、多点交叉:选定\(k\)个点在区间内交换。
  • 修正交叉:分为部分匹配交叉PMX、顺序交叉OX。
    解释:部分匹配交叉即两点交叉后,区间外与区间内重复的部分通过区间内两点内的一一对应关系(若对应的部分在区间外不存在)把其他的位置重复的调换(替换非法解),顺序交叉即将两点内交换后,对交换后区间外的部分进行排序,并去除区间内的部分直接按顺序填入即可。(直接生成合法解)
  • 位点(分二进制和整数(概率选择,为消除非法性可将被选中的基因改为被选中的基因:)))、逆转、插入、互换(随机选取两个基因互换)

流程图见教材即可:即编码问题、初始化种群、计算适应度值、分析是否到达终止节点、分别输出最优解或根据适应度变异交叉。

粒子群优化算法
  • 公式:

\[v^i_j(k+1)=\omega(k)v^i_j(k) + \varphi_1 rand(0, a_1)(p^i_j(k)- x^i_j(k))+\varphi_2 rand(0, a_2)(p^g_j(k)- x^i_j(k)) \]

\[x^i_j(k + 1)=x^i_j(k)+v^i_j(k+1) \]

其中 $\left [ 0,a_1 \right ] , \left [ 0,a_2 \right ] $ 为满足均匀分布的随机数,\(\varphi_1, \varphi_2\) 为非负的加速度常数,分别代表个体和群体的学习率,\(\omega\)为惯性权重,代表了粒子群的探索力。根据公式和预设误差逐步迭代即可。

  • 注意速度每维度设置边界最大速度\(V_max\),过高可能错过好的解,过低容易陷入局部过快最优。
    实例:计算函数最大最小值等(暂未拓展)
蚁群算法

TSP中的应用:计算某时刻蚂蚁选择从\(i\)\(j\)的概率
公式:

  • \(\tau_{ij}\):路径 \(i \to j\) 的信息素浓度
  • \(\eta_{ij} = 1 / d_{ij}\):路径的启发函数
  • \(\alpha\):控制信息素重要程度
  • \(\beta\):控制启发信息重要程度
  • \(allowed_k(x) = \left \{ 1,..., n \right \} -tabu_k(x)\):在全集中减去走过的城市表示合法的城市。

\[P^k_{xy}(t)=\left\{\begin{array}{cl}\frac{\left [ \tau_{xy}(t) \right ]^\alpha \left [ \eta _{xy} \right ]^\beta}{\sum\limits_{y\in allowed_k(x)} {\left [ \tau_{xy}(t) \right ]^\alpha \left [ \eta _{xy} \right ]^\beta}} & if \,\,\,\,\,\,y\in allowed_{k}(x), \\ 0 & other\end{array}\right. \]

\[\tau_{xy}(t+1)=\rho(\rho \in \left [0,1 \right ])*\tau{xy}(t)+\delta\tau_{xy}(t) \]

\[\tau_{xy}(t)=\sum\limits^{m}_{k=1}\delta\tau^k_{xy}(t) \]

其中\(\delta\tau^k_{xy}(t)\)一般为所走路径长度相关\(\frac{Q}{L_k}\)

专家系统

本章主要复习专家系统的一般结构以及各个结构的工作过程、以及部分机器学习的宽泛概念,学习使用构成专家系统的库。
一般包含人机接口、解释机构、知识获取机构、综合数据库、知识库、推理机六部分。

  • 知识库:包含了合适的知识表示方法表达出来的知识,以及对应的知识库管理系统(组织、检索、维护、安全防护)
  • 推理机:根据已知事实以及知识库中的知识,按照一定的推理方法(确定性和不确定性推理)和控制策略(包含推理方向:正反以及混合、以及搜索策略等)推理得出结论。(见第三章概念)
  • 综合数据库:用户提供的初始化事实,随着推理产生的中间结果以及相应的管理系统。与知识库的区别是运行过程中会发生变化而不是只能在接口处输入。
  • 知识获取机构:获取知识并把知识转化成可存储形式并存入知识库。
  • 人机接口:专家系统与用户等交互的界面,包含一系列程序和硬件,用于完成输入输出。
  • 解释机构:回答用户提出的问题,解释推理过程。
知识获取

包含抽取、转换(形式转换)、输入(编辑编译输入知识库)、检测(每个环节应都需要)

  • 知识获取的三种模式:自动、半自动、非自动。
    `
posted @ 2025-05-04 12:10  Clematis068  阅读(178)  评论(0)    收藏  举报