国家科技成果网
热门搜索:  激光   高分子   石油   并网   纳米   太阳能光伏
扫描二维码关注国科网

国家科技成果网 首页 成果 查看内容

智能体在部分可观测马尔可夫环境下的激励学习研究

2002年 应用技术
  • 成果简介
如何解决智能体在未知环境下学习和如何建立能够有效求解大状态空间部分可观测环境下学习问题的算法,是本项目两个拟解决的关键问题。项目把提出一个充分、有效的、能够不依赖预先环境知识的智能体内部状态及策略表达方式作为核心研究内容和解决上述两个关键问题的主要手段。项目是按计划进行的,项目研究基本达到了预期目标。主要研究成果如下:(1)提出了广义动作序列的智能体内部状态表达方式和相应学习规则:智能体的...
相关成果

标签云

相关机构

Copyright 2001-2020 All Rights Reserved© 国科网 版权所有
国家科技成果信息服务平台 主管单位:科学技术部火炬高技术产业开发中心
京ICP备09035943号-33 京公网安备110401400097
在线客服系统