本書系統(tǒng)地介紹過程挖掘的原理、方法、技術(shù)及其在教育領(lǐng)域的應(yīng)用,重點(diǎn)介紹基于Petri
net 的形式化挖掘技術(shù)和基于語義的挖掘技術(shù),并舉一個(gè)完整的挖掘大學(xué)校園學(xué)生行為特征的
案例。本書既有完整的理論框架又有專門的教育領(lǐng)域?qū)嵺`應(yīng)用,可供計(jì)算機(jī)、大數(shù)據(jù)、人工智
能等相關(guān)專業(yè)領(lǐng)域的學(xué)生和研究人員參考。
本書涵蓋了過程挖掘方法的理論框架,并詳細(xì)介紹了在教育領(lǐng)域的實(shí)踐與應(yīng)用
業(yè)務(wù)過程廣泛存在于工作流管理系統(tǒng)、業(yè)務(wù)過程管理系統(tǒng)、企業(yè)資源計(jì)劃系統(tǒng)等過程感知的信息系統(tǒng)以及半結(jié)構(gòu)化的分布式應(yīng)用中,過程挖掘技術(shù)從這些業(yè)務(wù)過程日志中提取有價(jià)值的知識(shí),可發(fā)現(xiàn)、監(jiān)控和改進(jìn)原有業(yè)務(wù)流程,是實(shí)現(xiàn)業(yè)務(wù)過程管理(BPM)的重要方法。過程挖掘研究包括過程發(fā)現(xiàn)、符合性檢查、模型改進(jìn)三方面,其中過程發(fā)現(xiàn)的目標(biāo)是從事件日志中構(gòu)造業(yè)務(wù)過程模型。當(dāng)前,過程挖掘已廣泛應(yīng)用在醫(yī)療、金融、教育、電子商務(wù)等領(lǐng)域。
本書在總結(jié)歸納過程挖掘歷史和發(fā)展的基礎(chǔ)上,主要闡述基于工作流網(wǎng)(WF-net)的過程發(fā)現(xiàn)算法,側(cè)重于復(fù)雜控制流結(jié)構(gòu)發(fā)現(xiàn)算法研究,并介紹其在教育領(lǐng)域的應(yīng)用。全書分為5章,包括基本概念、基本算法、應(yīng)用實(shí)例以及軌跡挖掘中新的研究方向。第1章是過程挖掘概述,是對(duì)全書描述的問題的鋪墊,介紹了過程挖掘基本概念、任務(wù)、研究現(xiàn)狀和挑戰(zhàn)。第2章是Petri net 過程挖掘概述,闡述了形式化算法的代表理論P(yáng)etri net,系統(tǒng)介紹了日志的表示、WF-net 等概念,這是全書研究的理論基礎(chǔ)。第3章是WF-net 過程挖掘技術(shù),系統(tǒng)介紹了? 系列算法,并闡述了短循環(huán)結(jié)構(gòu)和重復(fù)任務(wù)問題的挖掘算法,開拓復(fù)雜控制流結(jié)構(gòu),發(fā)現(xiàn)算法研究新思路。第4章是教育物聯(lián)網(wǎng)過程挖掘應(yīng)用,把過程發(fā)現(xiàn)算法應(yīng)用到教育物聯(lián)網(wǎng)領(lǐng)域的一卡通RFID應(yīng)用分析實(shí)踐中,重點(diǎn)研究事件日志質(zhì)量和多角度過程挖掘分析方法,闡述了某高校教育管理實(shí)例應(yīng)用。第5章是基于語義的過程挖掘技術(shù),在軌跡挖掘研究中引入過程挖掘技術(shù),闡述了基于主題模型LDA 的語義軌跡挖掘方法。
本書系統(tǒng)闡述了WF-net過程挖掘技術(shù),提出了解決短循環(huán)結(jié)構(gòu)和重復(fù)任務(wù)問題的挖掘算法,并進(jìn)一步拓展至軌跡挖掘領(lǐng)域,理論體系完整又有所創(chuàng)新,基于物聯(lián)網(wǎng)的高校一卡通案例增強(qiáng)了本書的應(yīng)用參考價(jià)值。
本書在清華大學(xué)出版社相關(guān)領(lǐng)導(dǎo)和專家、編輯的信任、指導(dǎo)、支持和幫助下完稿并出版,同時(shí),本書是廣東省普通高校創(chuàng)新團(tuán)隊(duì)項(xiàng)目數(shù)據(jù)科學(xué)與智慧教育創(chuàng)新團(tuán)隊(duì)(2021KCXTD038)、廣東省省級(jí)科技計(jì)劃項(xiàng)目基于物聯(lián)網(wǎng)的陶瓷生產(chǎn)遠(yuǎn)程監(jiān)控平臺(tái)研究(2015A010103015)、廣東省教育廳創(chuàng)新強(qiáng)校資金基于過程發(fā)現(xiàn)和主題模型的RFID數(shù)據(jù)軌跡挖掘及應(yīng)用研究(2017KTSCX123)、廣東省普通高校重點(diǎn)實(shí)驗(yàn)項(xiàng)目數(shù)據(jù)科學(xué) 與智慧教育重點(diǎn)實(shí)驗(yàn)室(2022KSYS003)的研究成果,也參考了國(guó)內(nèi)外相關(guān)研究。在此,謹(jǐn)致謝意!
馮健文
2022年7月
第 1 章 過程挖掘概述 1
1.1 過程挖掘概念 1
1.2 過程發(fā)現(xiàn)算法 4
第 2 章 Petri net 過程挖掘概述 11
2.1 事件日志 11
2.2 Petri net 13
2.3 WF-net 15
2.4 SWF-net 15
第 3 章 WF-net 過程挖掘技術(shù) 17
3.1 WF-net 過程發(fā)現(xiàn)算法 17
3.2 挖掘短循環(huán)的過程挖掘算法 21
3.3 挖掘重復(fù)任務(wù)的過程挖掘算法 34
第 4 章 教育物聯(lián)網(wǎng)過程挖掘應(yīng)用 63
4.1 一卡通 RFID 業(yè)務(wù)管理決策需求 64
4.2 一卡通過程挖掘方法框架 69
4.3 設(shè)計(jì)模型 71
4.4 一卡通數(shù)據(jù)預(yù)處理 72
4.5 多角度過程挖掘分析 77
4.6 實(shí)例研究 81
第 5 章 基于語義的過程挖掘技術(shù) 104
5.1 軌跡挖掘概述 104
5.2 基于過程發(fā)現(xiàn)和 LDA 的 RFID 軌跡數(shù)據(jù)挖掘方法 110
5.3 基于過程發(fā)現(xiàn)的 RFID 數(shù)據(jù)軌跡生成方法 115
5.4 基于 LDA 的大學(xué)一卡通學(xué)生行為特征分析研究 120
參考文獻(xiàn) 125