關(guān)于我們
書單推薦
新書推薦
|
|
人的智能和AI賦能的機器智能在自動化控制領(lǐng)域的共融共存形成了人機混合智能系統(tǒng)這一新型的系統(tǒng)形式和智能形式。一方面,這類系統(tǒng)所代表的系統(tǒng)結(jié)構(gòu)形式是傳統(tǒng)自動化控制系統(tǒng)應(yīng)對AI賦能的機器智能變革的必然發(fā)展形勢;另一方面,它所代表的智能形式也成為AI未來發(fā)展的重要甚至是的終極形式。在本《人機混合智能系統(tǒng)自主性理論和方法》,我們試圖拋磚引玉,對這一全新而重要的研究領(lǐng)域提供初步但系統(tǒng)性的思考。《人機混合智能系統(tǒng)自主性理論和方法》共分10章,第1章首先討論了人工智能時代人機系統(tǒng)的新發(fā)展,然后分別介紹人機混合智能系統(tǒng)的自主性基本理論(第I部分,包括第2~5章)和設(shè)計方法(第Ⅱ部分,包括第6~10章),涵蓋了人機混合智能系統(tǒng)的自主性定義、邊界判定、各種介入控制和共享控制方法等重要內(nèi)容。
更多科學(xué)出版社服務(wù),請掃碼獲取。
目錄 前言 第1章 人工智能時代人機系統(tǒng)的新發(fā)展 1 1.1 面向自動化控制的人機系統(tǒng) 1 1.1.1 系統(tǒng)、機器和人 1 1.1.2 人機系統(tǒng)典型例子 3 1.1.3 研究人機系統(tǒng)的必要性 5 1.1.4 人機系統(tǒng)相關(guān)研究領(lǐng)域 6 1.2 人工智能時代的人機混合智能系統(tǒng) 8 1.2.1 人工智能技術(shù)的未來展望 8 1.2.2 弱人工智能與人機混合智能系統(tǒng) 11 1.2.3 人機混合智能系統(tǒng)的典型例子和場景 15 1.2.4 人機混合智能系統(tǒng)中人的位置 20 1.3 人機混合智能系統(tǒng)的研究挑戰(zhàn) 21 1.3.1 作為關(guān)鍵核心的自主性 21 1.3.2 人機混合智能系統(tǒng)及其自主性的相關(guān)研究 22 1.3.3 人機混合智能系統(tǒng)研究面臨的挑戰(zhàn) 28 1.3.4 學(xué)術(shù)界和政府關(guān)注 29 1.4 本章小結(jié) 30 第I部分 人機混合智能系統(tǒng)自主性理論 第2章 人機混合智能系統(tǒng)基于空間和邊界概念的自主性描述框架 33 2.1 人機混合智能系統(tǒng)的自主性及其邊界 33 2.1.1 人機混合智能系統(tǒng)的智能與自主性的一般討論 33 2.1.2 人機混合智能系統(tǒng)的自主性空間 36 2.1.3 人機混合智能系統(tǒng)的自主性邊界 39 2.2 自主性空間和自主性邊界的擴展 41 2.2.1 自主性邊界 42 2.2.2 自主性相對空間和相對邊界 43 2.3 人與機器自主決策的聯(lián)合形式表示 44 2.4 本章小結(jié) 45 第3章 人機混合智能系統(tǒng)基于自主性聯(lián)合空間和聯(lián)合邊界的設(shè)計框架.46 3.1 人機混合智能系統(tǒng)的基本控制策略和設(shè)計框架 46 3.1.1 人機混合智能系統(tǒng)的基本控制策略:介入控制和共享控制 46 3.1.2 人機混合智能系統(tǒng)的基本設(shè)計框架:自主性聯(lián)合空間和聯(lián)合邊界 49 3.2 人在環(huán)上:人機混合智能系統(tǒng)的介入控制 52 3.2.1 機器(單向)介入控制 52 3.2.2 人的(單向)介入控制 53 3.2.3 人機切換(雙向介入)控制 54 3.3 人在環(huán)內(nèi):人機系統(tǒng)中人與機器的共享控制 56 3.3.1 基本共享控制 56 3.3.2 擴展共享控制 57 3.4 本章小結(jié) 58 第4章 自主性邊界:深度學(xué)習(xí)不確定性的定量刻畫 59 4.1 面向人機混合智能系統(tǒng)的深度學(xué)習(xí)不確定性的定量刻畫 59 4.2 基于貝葉斯模型刻畫深度學(xué)習(xí)不確定性的幾種代表性方法 61 4.2.1 Probabilistic backpropagation方法 61 4.2.2 Bayes by backprop方法 63 4.2.3 MC dropout方法 65 4.3 模型不確定性在強化學(xué)習(xí)中的應(yīng)用 66 4.3.1 通過量化模型不確定性促進深入探索 67 4.3.2 通過量化模型不確定性實現(xiàn)動態(tài)避障 68 4.4 本章小結(jié) 69 第5章 自主性邊界:不同場景下的典型判定及應(yīng)用 70 5.1 介入控制下的自主性邊界典型判定及應(yīng)用 70 5.1.1 機器介入人:利用自主性邊界的判定優(yōu)化機器對人的小干預(yù) 70 5.1.2 人介入機器:利用自主性邊界的判定優(yōu)化強化學(xué)習(xí)算法 74 5.2 共享控制下的自主性邊界典型判定及應(yīng)用 77 5.2.1 共享控制中的自主性邊界判定 77 5.2.2 基于仲裁機制的人機共享控制 79 5.2.3 利用自主性邊界優(yōu)化基于仲裁機制的人機共享控制 80 5.3 本章小結(jié) 82 第II部分 人機混合智能系統(tǒng)設(shè)計方法 第6章 人在環(huán)上:人的認知提升機器智能 85 6.1 利用人的認知特性提升機器學(xué)習(xí)算法性能的基本思想 85 6.2 利用人的認知心理模型提升機器智能 86 6.2.1 樸素貝葉斯算法介紹 87 6.2.2 利用人的認知特性的拉普拉斯平滑模型對樸素貝葉斯算法性能的提升 89 6.2.3 利用人的認知特性的松散對稱模型對樸素貝葉斯算法性能的提升 91 6.2.4 引入松散對稱模型提升基于拉普拉斯平滑的樸素貝葉斯算法的性能 94 6.3 利用人的生理認知特性提升機器智能 96 6.3.1 目標識別任務(wù)中人的生理認知特性測量 96 6.3.2 利用人腦視覺神經(jīng)的活動特點改進支持向量機算法 97 6.4 本章小結(jié) 100 第7章 人在環(huán)上:人的介入增強AI系統(tǒng)可靠性 101 7.1 增強AI系統(tǒng)可靠性的必要性和重要性.101 7.1.1 對AI系統(tǒng)可靠性的要求 101 7.1.2 現(xiàn)有技術(shù)框架難以從本質(zhì)上保證AI系統(tǒng)的可靠性 103 7.2 人的介入增強AI系統(tǒng)可靠性的思路和方法框架 104 7.2.1 人的介入增強AI系統(tǒng)可靠性的基本思路 104 7.2.2 人的介入增強AI系統(tǒng)可靠性的基本框架 105 7.3 人的介入提升珍珠分揀準確性 107 7.3.1 方法和實驗設(shè)置 107 7.3.2 獨立網(wǎng)絡(luò)模型的搭建及訓(xùn)練.108 7.3.3 基于人的分歧介入方法的珍珠分揀實驗結(jié)果 109 7.4 本章小結(jié) 109 第8章 人在環(huán)內(nèi):基于POMDP的共享自主 110 8.1 POMDP模型及其求解 110 8.1.1 POMDP模型表示 110 8.1.2 POMDP模型求解 112 8.2 基于POMDP的人機共享自主典型實例 113 8.2.1 利用POMDP實現(xiàn)汽車車道保持的共享自主 114 8.2.2 利用POMDP實現(xiàn)智能學(xué)習(xí)輔助系統(tǒng)的共享自主 116 8.3 過度信任和缺乏信任在基于POMDP的共享控制框架下的解釋 118 8.4 本章小結(jié) 120 第9章 人在環(huán)內(nèi):基于強化學(xué)習(xí)的共享控制 121 9.1 強化學(xué)習(xí)和深度強化學(xué)習(xí)基本知識 121 9.1.1 強化學(xué)習(xí)基本知識 121 9.1.2 深度強化學(xué)習(xí)基本知識 124 9.2 基于強化學(xué)習(xí)的共享控制典型方法 127 9.2.1 基于DQN的無須先驗知識的共享控制方法 127 9.2.2 基于SAC的無須預(yù)先訓(xùn)練的共享控制方法 129 9.2.3 基于AC的無須動態(tài)模型的共享控制方法 132 9.3 基于強化學(xué)習(xí)的共享控制實例 134 9.4 本章小結(jié) 136 第10章 人在環(huán)內(nèi):人機序貫決策的共享控制 138 10.1 序貫決策的基本概念.138 10.2 人機序貫決策問題的典型場景.141 10.2.1 人參與問題的人機序貫決策 141 10.2.2 人介入方法的人機序貫決策 142 10.3 基于POMDP方法求解人參與問題的人機序貫決策問題 143 10.3.1 人參與問題的人機序貫決策問題的POMDP框架概述 143 10.3.2 人機系統(tǒng)的POMDP框架實現(xiàn)駕駛輔助系統(tǒng)中的車道保持 145 10.4 基于MPC方法求解人參與問題的人機序貫決策問題 147 10.4.1 人參與問題的人機序貫決策問題的MPC框架概述 147 10.4.2 人機系統(tǒng)的MPC框架實現(xiàn)輔助駕駛系統(tǒng)中的車輛變道 148 10.5 基于RL方案求解人介入方法的人機序貫決策問題 150 10.5.1 人介入方法的人機序貫決策問題的RL框架概述 150 10.5.2 人機系統(tǒng)的RL框架實現(xiàn)倒立擺系統(tǒng)性能的提升 152 10.6 本章小結(jié) 154 參考文獻 155 索引 167 插圖目錄 169 表格目錄171 算法目錄 172 定義列表 173 例子列表 174
|