第1章 為什么需要多個機器人
1.1 多機器人的優(yōu)點
1.2 經典問題
1.3 智能體與多智能體系統
1.4 多智能體機器人學
第2章 合作式機器人的控制
2.1 與合作有關的研究
2.1.1 分布式的人工智能
2.1.2 分布式系統
2.1.3 生物學
2.2 學習, 進化與適應
2.3 多機器人控制的設計
第3章 主要的機器人技術
3.1 基于行為的機器人技術
3.2 集體機器人技術
3.3 進化機器人技術
3.4 來自生物學與社會學的啟發(fā)
3.5 總結
第4章 計算模型與技術
4.1 強化學習
4.1.1 馬爾可夫決策過程
4.1.2 強化學習算法
4.1.3 時間差分技術
4.1.4 Q-學習
4.1.5 多智能體強化學習
4.2 遺傳算法
4.3 人工生命
4.4 人工免疫系統
4.5 概率建模
4.6 有關多機器人規(guī)劃與協調的研究
第5章 多智能體機器人系統設計主要的研究課題
5.1 自組織
5.2 局部性能與全局性能
5.3 規(guī)劃
5.4 多機器人學習
5.5 協同進化
5.6 隱現行為
5.7 反應式系統與推理式系統
5.8 異類系統與同類系統
5.9 模擬機器人與實體機器人
5.10 多智能體機器人系統的動力性
5.11 總結
第6章 多智能體強化學習中的技術
6.1 自治的群體機器人
6.1.1 概述
6.1.2 感知能力
6.1.3 遠程式傳感器
6.1.4 短程傳感器
6.1.5 激勵提取
6.1.6 簡單行為
6.1.7 運動機制
6.2 多智能體強化學習
6.2.1 強化學習的原理
6.2.2 行為選擇機制
6.3 多智能體強化學習工具箱
6.3.1 體系結構
6.3.2 文件組織
6.3.3 函數說明
6.3.4 用戶設置
6.3.5 數據結構
6.4 總結
第7章 多智能體強化學習中的結果分析
7.1 測量
7.1.1 激勵頻率
7.1.2 行為選擇頻率
7.2 群體行為
7.2.1 集體包圍
7.2.2 RANGER機器人間的合作
7.2.3 不同機器人群的并發(fā)學習
第8章節(jié) 多智能體強化學習中的要素
8.1 集體感知
8.2 初始空間分布
8.3 反S型函數
8.4 行為選擇機制
8.5 運動機制
8.6 隱現的周期性運動
8.7 宏觀隱定而微觀不穩(wěn)定的屬性
8.8 主導行為
第9章 進化的多智能體強化學習
9.1 機器人群示例
9.1.1 目標的空間分布
9.1.2 目標的運動特征
9.1.3 行為學習機制
9.2 進化群體運動策略
9.2.1 染色體表示
9.2.2 適應度函數
9.2.3 算法
9.2.4 遺傳算法中的參數
9.3 例子
9.4 進化的多智能體強化學習工具箱
9.4.1 文件組織
9.4.2 函數說明
9.4.3 用戶設置
9.5 總結
第10章 雙智能體系統中的協同行為
10.1 研究重點
10.2 雙智能體的學習
10.3 雙智能體系統的特殊角色
10.4 機器人智能體的基本能力
10.5 建議提供智能體的基本原理
10.5.1 基本動作——學習的先決條件
10.5.2 一般性行為的遺傳規(guī)劃
10.5.3 特殊策略必行為的遺傳規(guī)劃
10.6 復雜行為的學習
10.6.1 實驗設計
10.6.2 機器人環(huán)境的復雜性
10.6.3 實驗結果
10.6.4 平面姿態(tài)
10.6.5 曲線姿態(tài)
10.6.6 角姿態(tài)
10.6.7 點姿態(tài)
10.7 總結
第11章 集體行為
11.1 群體行為
11.1.1 什么是群體行為
11.1.2 群體行為學習回顧
11.2 方法
11.2.1 基本思想
11.2.2 群體機器人
11.2.3 集體推箱的性能標準
11.2.4 集體推箱行為的進化
11.2.5 遠程的進化計算智能體
11.3 應用排斥力的集體推箱
11.3.1 人工排隊斥力模型
11.3.2 推力與箱子的相應運動
11.3.3 染色體表示
11.3.4 適應度函數
11.3.5 例子
11.4 用外部設備接觸力與矩集體推箱
11.4.1 3個群體機器人與箱子之間的交互作用
11.4.2 推圓柱體箱子
11.4.3 推立方體箱子
11.4.4 染色體表示
11.4.5 適應度函數
11.4.6 例子
11.5 最優(yōu)保留進生命線的收斂性分析
11.5.1 馬爾可夫鏈的轉移矩陣
11.5.2 用特征值描述轉移矩陣特征
11.6 進化的集體行為實現工具箱
11.6.1 用人工排指斥力集體推箱的工具箱
11.6.2 實現推圓柱子箱子或立方體箱子任務的工具箱
11.7 總結
第12章 多智能體的自組織
12.1 人工勢能場
12.1.1 基于人工勢能場的運動規(guī)劃
12.1.2 集體勢能場圖的構建
12.2 自組織概述
12.3 勢能場圖的自組織
12.3.1 機器人的坐標系
12.3.2 接近度測量
12.3.3 鄰域的距離聯想
12.3.4 勢能場圖的遞增式自組織
12.3.5 機器人的運動選擇
12.4 實驗12-1
12.4.1 實驗設計
12.4.2 實驗結果
12.5 實驗12-2
12.5.1 實驗設計
12.5.2 實驗結果
12.6 討論
12.7 多智能體自組織工具箱
12.7.1 體系結構
12.7.2 文件組織
12.7.3 函數說明
12.7.4 用戶設置
12.7.5 數據結構
第13章 進化的多智能體自組織
13.1 合作式運動策略的進化
13.1.1 接近度激勵的表示
13.1.2 激勵-反應對
13.1.3 染色體表示
13.1.4 適應度函數
13.1.5 算法
13.2 實驗13-1
13.2.1 實驗設計
13.2.2 與非進化模式的比較
13.2.3 實驗結果
13.3 討論
13.3.1 群體行為的進化
13.3.2 機器人的合作
13.4 進化的多智能體自組織工具箱
13.4.1 體系結構
13.4.2 文件組織
13.4.3 函數說明
13.4.4 用戶設置
13.4.5 數據結構
13.5 總結
第14章 多智能體機器人技術工具箱
14.1 概述
14.2 例子
14.2.1 真實圖的計算
14.2.2 初始化
14.2.3 開始
14.2.4 結果顯示
參考文獻
索引