仅用作记录个人学习课程,课程介绍如下
学习时间:2023/09 - 2023/10
人工智能导论。主要介绍智能系统设计的基本思想和技术,统计和决策理论建模方法相关的内容。 课程链接
- Depth First Search 深度优先搜索
UCS 的基本思想是从起始节点开始,不断扩展当前成本最低的节点,直到达到目标节点或搜索空间中没有更多节点可供扩展。
- A* Search & Heuristic 启发式方法
A*搜索算法是一种常用于寻找最短路径或最优解的启发式搜索算法,路径的实际成本(已经花费的代价)和预估的剩余成本(从当前节点到目标节点的估计代价)。
-
Reflex Agent 3/4
-
Minimax 最小最大算法
Minimax 算法的主要目标是帮助一个玩家找到在对手采取最优策略的情况下,自己能够获得的最大利益,或者说最小化可能的最大损失。
-
Alpha-Beta Pruning
Alpha-Beta剪枝是一种优化Minimax算法的技术,用于在博弈树搜索中减少计算开销。Alpha和Beta分别是两个参数,它们用于跟踪在搜索过程中找到的最佳值。Alpha表示Max层(当前玩家)已经找到的最佳值,而Beta表示Min层(对手)已经找到的最佳值。
-
Expectimax
Expectimax(期望极大算法)是一种用于解决概率性决策问题的算法,通常用于博弈、规划和其他与不确定性相关的问题。该算法的名称来自于"expectation"(期望)和"maximization"(极大化)两个词的组合,这反映了它的工作原理。
-
Value Iteration & Asynchronous Value Iteration 价值迭代
Value Iteration 算法的主要目标是计算每个状态的价值函数,即从每个状态开始执行最佳策略所能获得的期望累积奖励。这个过程通常通过反复迭代来实现,直到价值函数收敛为止。
-
Q-Learning
-
Approximate Q-Learning
-
Exact Inference 精确推断
指在概率图模型(如贝叶斯网络或马尔可夫随机场)中进行精确概率计算的过程。这种推断方法旨在精确地计算给定一组观测数据条件下的概率分布或概率查询。
-
Approximate Inference 近似推断
项目采用粒子滤波(Particle Filtering)做近似推断,通过一组随机粒子来估计系统状态的后验分布。
-
DBNs 动态贝叶斯网络
是一种用于建模时间序列数据和动态系统的概率图模型,它是贝叶斯网络的扩展,用于表示和推断关于随时间变化的随机变量之间关系的概率模型。
- Perceptron 感知机
- Non-linear Regression 非线性回归
$sin(x)$ 函数
- MLP 多层感知机 数字图像 0-9 识别
- RNN 循环神经网络 语言识别

















