[AI] LRTA*(K) 搜索算法

LRTA*[k]搜索算法

  • 一、理论
  • 二、实际应用步骤

一、理论

LRTA*(K) 是LRTA* 算法的进阶版,关于LRTA*的回顾请点此处LRTA*(K) 论文请点此处

该文作者把LRTA算法归为 无界传播(unbounded propagation, 中文用谷歌翻译的。。。囧),LRTA(K)归为有界传播(bounded propagation)

所谓无界传播:先让agent移动到新的位置,然后更新上一个位置的 h(n), 这样并不会立即更新该新位置的 h(n),而是指望未来再次移动后才会更新该位置的值。被更改 h 后的位置的影响会进一步传播给其后继,依此类推。 该过程不断迭代,直到没有执行进一步的更改。

有界传播:限制一步最多只能更新有限K个位置的h ,这样用于传播的计算量就是有界的。在此说明:这k个位置只能是从初始位置到当前位置的路径之间的位置

LRTA* 算法的缺点如下:

  • 在有限的时间内移动。无界传播中涉及的状态数在连续步骤中可能不同,因此所需的计算量可能会在步骤之间发生变化(说实话,这里我没看懂)。 这违背了实时搜索必须在限定时间内执行单个移动的要求。

  • 作用于附近。 无界传播可以远离当前状态。 这违反了实时搜索的基本假设,即前瞻和更新操作只能在当前状态附近完成。(我没明白,无界传播不也是在当前状态附近来回震荡直到跳出局部最小值吗?)

LRTA*(K)优势如下:

  • 初解:如果第一个解不涉及循环,LRTA*(K)将表现为LRTA*,然而,这种情况很少发生。实验上,LRTA*(K)在较短的计算时间内发现了比LRTA更短的解。

  • 收敛:LRTA*(K)记录的h值更接近精确值,这导致LRTA*(K)在测试基准中比LRTA*(步骤数、试验次数和总CPU时间)更快地收敛。其他算法(FALCONS)也会出现这种情况。

  • 解的稳定性:获得更高质量的解使解决方案和增加的稳定性之间的差异更小。

二、实际应用步骤

在这里插入图片描述

题目介绍:

  • 如图A左侧,有这么一个网格,每个格子都用字母标了号便于说明

  • 右侧是每个格子初始的h值,“-” 表示墙,数字表示可走的路径。

  • 格子m是起点,p是终点,每个格子之间的代价 g = 1。

在这里插入图片描述

使用 LRTA*(K) 算法的步骤如下:

  • 首先先设定 k=5, 那么m的h值就直接更新到 h(m) = 5。由于路径上没有其他位置,也就没有传播。在这次迭代中,1个位置(m)被考虑更新

  • Agent移动到位置 i, h(i) 直接更新 h(i) = h(m) + g(m, i) = 5 + 1 = 6。 此时考虑当前位置 i 的前一个位置 m 的 h 值,考虑 m 的 h 值更新 h(m)=6+1=7,考虑 m 的后继 h(i)的值,h(i)不变。在这次迭代中,3个位置(i, m, i) 被考虑到

  • Agent移动到位置 e,h(e) 更新到h(e) = h(i) + g(i, e) = 6+1 = 7。考虑当前位置 e 的前一个位置 i 的h值,h(i) = 7+1=8, i 有两个后继 m 和 e(均在路径上),h(e) 不更新,h(m) = 8+1=9。然后考虑m的后继 i,h(i)不变。在这次迭代中,5个位置(e, i, e, m, i) 被考虑到。

  • Agent移动到a,最终移动到目标 g

写在最后,其实我也理解的不是很深,具体算法如下:

在这里插入图片描述


http://www.niftyadmin.cn/n/11145.html

相关文章

微型计算机原理速通期末复习

文章目录微机基础原码、反码、补码、移码溢出实数型功能结构8086/8088内部结构80286内部结构80386/80486内部结构标志寄存器FLAGS寄存器阵列段寄存器寻址标志寄存器EFLAGS分段结构数据寻址方式立即寻址直接寻址寄存器寻址寄存器间接寻址寄存器相对寻址基址-变址寻址基址-变址-相…

1532_AURIX_TriCore内核架构_中断

全部学习汇总: GreyZhang/g_tricore_architecture: some learning note about tricore architecture. (github.com) 中断一直是我想了解关注的一个功能模块,因为感觉不同的芯片上这部分的设计差异比较大。而这部分也跟我们嵌入式软件的设计模式直接相关。…

Arcpy新增随机高程点、空间插值及批量制图

(1)在“地质调查点基础数据表.xls”中图幅范围内增加200个随机位置的高程点。构建一个shape文件,采用自定义工具的模式,参数有两个:一个是让用户选择excel文件,一个让用户指定新生成的文件名。 &#xff08…

java计算机毕业设计web开发数码产品推荐平台系统设计与实现源码+mysql数据库+系统+lw文档+部署

java计算机毕业设计web开发数码产品推荐平台系统设计与实现源码mysql数据库系统lw文档部署 java计算机毕业设计web开发数码产品推荐平台系统设计与实现源码mysql数据库系统lw文档部署本源码技术栈: 项目架构:B/S架构 开发语言:Java语言 开…

秋招面经第五弹:一家上市小公司二面-大数据开发工程师

秋招第五弹:一家上市小公司二面-大数据开发工程师 写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题&#xff0…

java-net-php-python-11jspm健身管理网站计算机毕业设计程序

java-net-php-python-11jspm健身管理网站计算机毕业设计程序 java-net-php-python-11jspm健身管理网站计算机毕业设计程序本源码技术栈: 项目架构:B/S架构 开发语言:Java语言 开发软件:idea eclipse 前端技术:Layu…

bash shell 初体验-尚文网络xUP楠哥

~~全文共1139字,阅读需约5分钟。 进Q群11372462,领取专属报名福利,包含云计算学习路线图代表性实战训练大厂云计算面试题资料! # bash shell 简介 我们在操作Linux系统时,绝大部分情况是通过命令行的方式输入指令,Li…

消防宣传科普|消防安全知识网上答题挑战赛活动方案

活动背景 为普及消防法律法规和消防安全知识,营造消防宣传月浓厚氛围。集团公司防火办通过“防火安全知识专项学习与竞答”小程序,开展“消防知识网上答题挑战赛”,提升全员消防安全意识,提高抗御火灾、自防自救和组织疏散能力。…