马尔可夫决策基础理论过程还有研究价值吗

对不起,您要访问的页面暂时没有找到,您可以:【图文】马尔可夫决策_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
马尔可夫决策
上传于|0|0|文档简介
&&人工智能 马尔可夫决策
大小:566.00KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢&>&&>&课程资源&>&专业指导&>&实用马尔可夫决策过程
实用马尔可夫决策过程
上传大小:1.28MB
(不是扫描版,很清晰的pdf)马尔可夫决策过程是研究随机环境下多阶段决策过程优化问题的理论工具.在过去的几十年
中, 随着生态科学、经济理论、通讯工程以及众多学科中需要考虑不确定因素和序列决策问题
的大量新模型的涌现, 进一步刺激了马尔可夫决策过程在理论上和应用领域中长足的发展.
本书从简单的例子开始, 介绍了马尔可夫决策过程的基本概念、决策过程以及一些常用
的基本理论.还介绍了多种最优准则, 包括有限阶段准则、折扣准则、平均准则、权重报酬准
则、概率准则等.从模型角度考虑了有限状态空间、可数状态空间和一般Borel 状态空间; 从
决策时间上来说, 考虑了离散时间、连续时间和半马氏决策时刻问题.本文还介绍了大量的应
用实例以及建模方法.本书可作为高年级大学生和研究生教材, 也可作为运筹学、管理科学、
信息科学、系统科学以及计算机科学和工程领域的学者和技术人员的参考书....展开收缩
综合评分:4.5(46位用户评分)
所需积分:3
下载次数:273
审核通过送C币
SAPUI5教程
创建者:jiangbo_phd
数学建模与matlab的碰撞
创建者:unou6xnu
python教程汇总
创建者:wyx100
{%username%}回复{%com_username%}{%time%}\
/*点击出现回复框*/
$(".respond_btn").on("click", function (e) {
$(this).parents(".rightLi").children(".respond_box").show();
e.stopPropagation();
$(".cancel_res").on("click", function (e) {
$(this).parents(".res_b").siblings(".res_area").val("");
$(this).parents(".respond_box").hide();
e.stopPropagation();
/*删除评论*/
$(".del_comment_c").on("click", function (e) {
var id = $(e.target).attr("id");
$.getJSON('/index.php/comment/do_invalid/' + id,
function (data) {
if (data.succ == 1) {
$(e.target).parents(".conLi").remove();
alert(data.msg);
$(".res_btn").click(function (e) {
var q = $("#form1").serializeArray();
console.log(q);
var res_area_r = $.trim($(".res_area_r").val());
if (res_area_r == '') {
$(".res_text").css({color: "red"});
$.post("/index.php/comment/do_comment_reply/", q,
function (data) {
if (data.succ == 1) {
var $dd = $target.parents('dd');
var $wrapReply = $dd.find('.respond_box');
console.log($wrapReply);
var mess = $(".res_area_r").val();
var str = str.replace(/{%header%}/g, data.header)
.replace(/{%href%}/g, 'http://' + window.location.host + '/user/' + data.username)
.replace(/{%username%}/g, data.username)
.replace(/{%com_username%}/g, _username)
.replace(/{%time%}/g, data.time)
.replace(/{%id%}/g, data.id)
.replace(/{%mess%}/g, mess);
$dd.after(str);
$(".respond_box").hide();
$(".res_area_r").val("");
$(".res_area").val("");
$wrapReply.hide();
alert(data.msg);
}, "json");
//填充回复
function KeyP(v) {
$(".res_area_r").val($.trim($(".res_area").val()));
/*删除回复*/
$(".del_comment_r").on("click", function (e) {
var id = $(e.target).attr("id");
$.getJSON('/index.php/comment/do_comment_del/' + id,
function (data) {
if (data.succ == 1) {
$(e.target).parent().parent().parent().parent().parent().remove();
$(e.target).parents('.res_list').remove()
alert(data.msg);
评论共有34条
书不错,里面的内容基本很多都是根据Puterman的MDP经典英文书翻译过来的,买了实体版,定价超级贵= =
似乎目前市面上关于马尔可夫决策过程为数不多的书,内容相对比较丰富.
很详细的教材,印刷质量也比较清晰
非常好的书 谢谢分享
似乎目前市面上关于马尔可夫决策过程为数不多的书,内容相对比较丰富.
比较实用的一本书
之前就看过这这本书 很不错
说实话这本书质量不咋地,内容结构不合理,不适合入门级的学习。
都说是本好书,浏览了一下应该不错。准备认真学习下。
非常感谢,书籍很清晰,正是我要找的。
上传者其他资源上传者专辑
《FPGA CPLD设计工具──Xilinx ISE使用详解》相关代码
《FPGA CPLD设计工具──Xilinx ISE使用详解》
MSK的viterbi解调
基于FPGA的交通灯代码
Bandwidth-Efficient Digital Modulation with Application to Deep-Space Communications.pdf
课程资源热门标签
VIP会员动态
前端开发重难点
17年软考最新真题及解析
物联网全栈开发专题
二十大技术领域优质资源
spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip
CSDN&vip年卡&4000万程序员的必选
实用马尔可夫决策过程
会员到期时间:剩余下载次数:
积分不足!
资源所需积分
当前拥有积分
您可以选择
程序员的必选
绿色安全资源
资源所需积分
当前拥有积分
VIP年卡全年1200次免积分下载
你当前的下载分为234。
你还不是VIP会员
开通VIP会员权限,免积分下载
你下载资源过于频繁,请输入验证码
你下载资源过于频繁,请输入验证码
您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:!
若举报审核通过,可奖励20下载分
被举报人:
举报的资源分:
请选择类型
资源无法下载
资源无法使用
标题与实际内容不符
含有危害国家安全内容
含有反动色情等内容
含广告内容
版权问题,侵犯个人或公司的版权
*详细原因:马尔可夫决策过程 -
- ITeye博客
定义 一个很简单的只有3个状态和2个动作的MDP例子。一个马尔可夫决策过程是一个4 - 元组 ,其中
S是状态的有限集合,
A是动作的有限集合(或者,As是处于状态s下可用的一组动作的有限集合),
表示 t时刻的动作 a 将导致马尔可夫过程由状态 s 在t+1 时刻转变到状态 s' 的概率 。
Ra(s,s') 表示以概率Pa(s,s')从状态 s 转变到状态 s' 后收到的即时奖励(或预计即时奖励)。(马尔可夫决策过程理论实际上并不需要 S 或 A 这两个集合是有限的,但下面的基本算法假定它们是有限的。)转载自http://blog.csdn.net/foxeatapple/article/details/6008686
浏览: 1317 次

我要回帖

更多关于 半马尔可夫决策过程 的文章

 

随机推荐