由于推薦系統(tǒng)開放性的特點,惡意用戶可以通過注入偽造的用戶概貌以改變目標項目在推薦系統(tǒng)中的排名,托攻擊行為干擾了推薦系統(tǒng)的正常運行,阻礙推薦系統(tǒng)的應用和推廣。
《推薦系統(tǒng)中基于目標項目分析的托攻擊檢測研究》提出了幾種托攻擊監(jiān)測的方法:提出一種基于目標項目分析的托攻擊檢測框架;在基于目標項目分析的托攻擊檢測框架基礎上提出了兩種托攻擊檢測算法;提出了一種結合目標項目分析和支持向量機的檢測方法;提出了一種基于目標項目分析和時間序列的托攻擊檢測算法。
個性化推薦技術作為一種解決信息超載問題最有效的工具,但是由于推薦系統(tǒng)開放性的特點,惡意用戶可以通過注入偽造的用戶概貌以改變目標項目在推薦系統(tǒng)中的排名,此類現(xiàn)象稱為托攻擊。托攻擊行為使推薦系統(tǒng)向用戶推薦被操縱的商品或信息,干擾了推薦系統(tǒng)的正常運行,阻礙推薦系統(tǒng)的應用和推廣。本書的主要內(nèi)容如下:
分析了推薦系統(tǒng)國內(nèi)外研究現(xiàn)狀和面臨的主要挑戰(zhàn);分析推薦系統(tǒng)中相似度計算方法、托攻擊檢測評價指標和現(xiàn)有的用于托攻擊檢測的概貌屬性,并對推薦系統(tǒng)中概貌屬性提取技術進行分析。
針對托攻擊群體性特征以及用戶評分矩陣稀疏性的特點,提出一種基于目標項目分析(TIA)的托攻擊檢測框架。首先,找出有攻擊嫌疑的疑似托攻擊用戶集合;其次,構建由這些疑似托攻擊用戶概貌組成的評分矩陣;最后,通過目標項目分析方法得到攻擊意圖和目標項目,檢索出托攻擊用戶。
通過分析真實用戶概貌和托攻擊用戶概貌屬性值的分布,在基于目標項目分析的托攻擊檢測框架基礎上提出了兩種托攻擊檢測算法,基于RDMA和DegSim概貌屬性的方法(RD-TIA)和基于一種新的概貌屬性DegSim‘的檢測方法(DeR-TIA)。
針對現(xiàn)有的SVM托攻擊檢測算法存在的缺陷以及推薦系統(tǒng)托攻擊檢測中存在的類不均衡問題,本書提出了使用自適應人工合成樣本方法Borderline-SMOTE來緩解類不均衡問題。提出了一種結合目標項目分析和支持向量機(SVM)的檢測方法(SVM~TIA)。
根據(jù)虛假用戶惡意注入的評分信息在時間節(jié)點上具有集中性的特點,以及真實評分與托攻擊評分在統(tǒng)計學上呈現(xiàn)的不同分布特征,提出了一種基于目標項目分析和時間序列的托攻擊檢測算法(TS-TIA)。
本書受國家自然科學基金面上項目“基于異構服務網(wǎng)絡分析的Web服務推薦研究”(No.61379158),國家自然科學基金青年基金項目“基于用戶生成信息分析和異常群組發(fā)現(xiàn)的推薦系統(tǒng)托攻擊檢測研究”(No.61602070)等項目的資助。
本書的編寫和出版受到了重慶大學軟件學院的大力支持,在此表示衷心的感謝。
限于本書作者的學識水平,書中疏漏之處在所難免,懇請讀者批評指正。
周魏,男,工學博士。國家建設高水平大學公派研究生項目-聯(lián)合培養(yǎng)博士研究生。香港理工大學博士后。主要研究方向為推薦系統(tǒng)和數(shù)據(jù)挖掘。近年來。主持國家自然科學基金1項,參研國家自然科學基金3項。博士后基金1項,國家科技支撐計劃課題1項,中央高?蒲袠I(yè)務專項基金各1項,重慶市自然科學基金1項。以第1作者發(fā)表學術論文9篇,其中SCI檢索期刊4篇。El檢索8篇,計算機領域國際知名會議4篇,其中5篇為CCF推薦會議和期刊。文俊浩,男,重慶大學軟件學院教授、博士生導師。近年來主要從事服務計算、數(shù)據(jù)挖掘等方面的研究。主持國家自然科學基金面上項目2項,主持國家“十一五”科技支撐計劃項目1項,主研國家自然科學基金2項,主持并參與省部級項目10余項。2015年獲國家教學成果二等獎(排名第2)。2014年獲國家教學成果二等獎(排名第1),2013年獲重慶市教學成果一等獎(排名第1),2011年獲重慶市科技進步二等獎(排名第1)。近年來。發(fā)表學術論文70余篇,其中SCI檢索20余篇,EI檢索30余篇。
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容和創(chuàng)新點
1.4 本書組織結構
1.5 本章小結
第2章 推薦系統(tǒng)與推薦系統(tǒng)托攻擊檢測綜述
2.1 推薦系統(tǒng)綜述
2.2 推薦系統(tǒng)托攻擊
2.3 推薦系統(tǒng)托攻擊檢測
2.4 概貌屬性綜述
2.5 本章小結
第3章 基于目標項目分析的推薦系統(tǒng)托攻擊檢測框架
3.1 問題的提出
3.2 推薦系統(tǒng)魯棒性分析
3.3 目標項目分析方法
3.4 基于目標項目分析的托攻擊檢測框架TIAF
3.5 本章小結
第4章 基于概貌屬性和目標項目分析的托攻擊檢測研究
4.1 基于概貌屬性和目標項目分析的托攻擊檢測框架
4.2 RD-TIA托攻擊檢測方法
4.3 DeR-TIA托攻擊檢測方法
4.4 實驗過程與結果分析
4.5 本章小結
第5章 基于支持向量機和目標項目分析的托攻擊檢測研究
5.1 問題的提出
5.2 相關理論
5.3 基于支持向量機和目標項目分析的托攻擊檢測
5.4 實驗過程與結果分析
5.5 本章小結
第6章 基于時間序列和目標項目分析的托攻擊檢測研究
6.1 問題的提出
6.2 時間序列建模
6.3 基于目標項目分析和時間序列的托攻擊檢測框架
6.4 實驗過程與結果分析
6.5 本章小結
第7章 結論與展望
7.1 主要結論
7.2 后續(xù)工作展望
參考文獻
《推薦系統(tǒng)中基于目標項目分析的托攻擊檢測研究》:
、偎阉饕媸侵高\用一定的策略,使用特定的程序?qū)ヂ?lián)網(wǎng)上的信息資源搜集整理,對信息組織和處理后,供用戶輸入關鍵詞查詢的系統(tǒng)。它搜集并整理互聯(lián)網(wǎng)上的信息并根據(jù)用戶的查詢關鍵詞返回相應結果。搜索引擎不僅能夠滿足人們絕大多數(shù)的搜索需求,還可以按照用戶的方式對搜索結果進行個性化排序。根據(jù)有關調(diào)查報告顯示,截至2014年6月,中國搜索引擎用戶數(shù)達到50749萬人,較去年同期增長3711萬人,增長率為7.9%。這表明搜索引擎已經(jīng)逐漸融人人們的日常生活之中。
搜索引擎雖然在用戶能提供明確需求時功能強大,但是它只能被動地向用戶展示信息,無法主動地向用戶提供服務,具有一定的局限性。同時對用戶而言,將需求表達成一個或者幾個合適的關鍵詞是一個較大的挑戰(zhàn)。例如,用戶面對成千上萬的音樂專輯時,往往難以找出符合自己興趣音樂的關鍵詞。此時搜索引擎難以提供有效的幫助,這就需要一個更為自動化的信息過濾工具幫助用戶從龐大的音樂庫中找到其感興趣的音樂。另外,搜索結果的排序受到用戶越來越多的關注,如何對搜索結果進行排序顯得尤為重要,而競價排名的出現(xiàn),也成為搜索引擎被人詬病的原因之一。
、谕扑]系統(tǒng)是一種通過分析用戶的歷史行為信息、使用習慣等向用戶主動推送信息的工具。電子商務是推薦系統(tǒng)的主要應用領域,在電子商務不斷發(fā)展壯大的今天,各種商品信息在電子商務網(wǎng)站上不斷涌現(xiàn),用戶往往需要花費大量的時間在各類商品信息中尋找自己想要的商品。推薦系統(tǒng)通過對用戶的歷史消費習慣、點擊情況等信息進行分析,向用戶呈現(xiàn)感興趣的甚至是潛在感興趣的商品,從而減少用戶瀏覽無用信息的時間以幫助用戶獲得更好的購物體驗,并且能夠為電子商務站點帶來更多的營業(yè)額。
推薦系統(tǒng)促進了電子商務的發(fā)展,同時電子商務的進一步發(fā)展依賴于推薦系統(tǒng)自身功能的完善。推薦系統(tǒng)需要用戶大量的歷史記錄作為預測的依據(jù),一般來說,用戶提供的歷史數(shù)據(jù)越多,推薦系統(tǒng)向用戶推薦的結果就越準確。推薦系統(tǒng)管理者希望用戶能夠提供對項目真實的評價從而使推薦系統(tǒng)能夠產(chǎn)生高質(zhì)量的推薦服務,然而在現(xiàn)實中,惡意用戶利用推薦系統(tǒng)評分驅(qū)動的工作機制與開放性的特點來謀求不正當利益。惡意用戶向推薦系統(tǒng)中注入虛假評價信息以達到干擾推薦系統(tǒng)正常推薦的目的,其結果是損害正常用戶的利益和推薦系統(tǒng)的信譽。例如在電子商務平臺中,部分廠商為了銷售更多的商品,向推薦系統(tǒng)注入虛假的評分信息或評論信息來提高商品在推薦系統(tǒng)中的排名;或者使用類似的方法打壓競爭對手銷售的產(chǎn)品,以此來提高自己商品的銷量,F(xiàn)實生活中也不乏這樣的例子:索尼影業(yè)公司就曾經(jīng)偽造電影評論信息來宣傳正在發(fā)行的電影;亞馬遜網(wǎng)站曾遭到外來的攻擊,當用戶瀏覽與宗教相關的書籍時,系統(tǒng)會向用戶推薦有關性方面的書籍。
為了減少虛假信息對于推薦系統(tǒng)的影響,推薦系統(tǒng)管理者探討使用各種技術防御惡意程序的攻擊。例如,實行實名制,審核系統(tǒng)用戶信息,增加惡意用戶向推薦系統(tǒng)中注入托攻擊概貌的難度;使用驗證碼,增加惡意程序的攻擊成本。然而,這些方法能阻止部分惡意程序,但同時也增加了正常用戶使用推薦系統(tǒng)的難度,不利于推薦系統(tǒng)的擴展。
除了惡意程序?qū)ν扑]系統(tǒng)的攻擊之外,現(xiàn)實中還有專門提供托攻擊服務的人群,被稱為“網(wǎng)絡水軍”。例如手機軟件公司為了推廣自己開發(fā)的軟件,通過雇傭網(wǎng)絡水軍來下載使用自己的軟件,使得軟件在軟件排行榜上的名次上升,吸引更多的用戶下載使用。網(wǎng)絡水軍的出現(xiàn)造成部分公司通過人為操縱下載量的方式長期占據(jù)軟件排行榜前列導致了不公平競爭。
……