【0dsyong.com--畢業(yè)實習(xí)總結(jié)】
論文關(guān)鍵詞:貝葉斯網(wǎng)絡(luò) 自適應(yīng)超媒體 用戶模型
論文摘要:本文通過分析超媒體系統(tǒng)中的不確定性因素,引A.T貝葉斯網(wǎng)絡(luò)方法。在介紹貝葉斯網(wǎng)絡(luò)概念的基礎(chǔ)上,分析了貝葉斯網(wǎng)絡(luò)的優(yōu)化方案,討論了自適應(yīng)超媒體系統(tǒng)中貝葉斯網(wǎng)絡(luò)構(gòu)造過程。
在自適應(yīng)超媒體系統(tǒng)中,其關(guān)鍵技術(shù)之一就是用戶建模,可以說,用戶模型既是自適應(yīng)超媒體系統(tǒng)的特點,也是難點。用戶建模技術(shù)將需要處理眾多的不確定因素,例如,如何準(zhǔn)確評估用戶的知識程度、如何準(zhǔn)確預(yù)測用戶的學(xué)習(xí)目標(biāo)、如何選取合適的學(xué)習(xí)計劃等都是一個值得深入研究的問題。
這些問題都涉及到用戶模型的兩個功能:評估和預(yù)測。而自適應(yīng)超媒體系統(tǒng)能否準(zhǔn)確生成合適的自適應(yīng)內(nèi)容和自適應(yīng)導(dǎo)航,對用戶的不確定信息的準(zhǔn)確評估是關(guān)鍵因素。而貝葉斯網(wǎng)絡(luò)最大的優(yōu)點就是處理不確定信息,因此本文將主要探討貝葉斯網(wǎng)絡(luò)技術(shù)在自適應(yīng)超媒體系統(tǒng)中的應(yīng)用。
1超媒體系統(tǒng)中的不確定性
在自適應(yīng)超媒體系統(tǒng)中,用戶建模過程中存在的不確定性因素最多,用戶模型就是在眾多的不確定因素的基礎(chǔ)上做出對用戶的評估和預(yù)測。用戶模型需要處理的不確定因素主要有如下幾類。
(1)關(guān)于用戶領(lǐng)域知識的初始掌握程度的不確定性。用戶對領(lǐng)域內(nèi)的知識掌握程度一般是無法確切衡量的。例如在教育超媒體系統(tǒng)中,學(xué)生的知識水平就存在很大的不確定性,這種不確定性在實際的課堂教學(xué)中也無法完全排除。一個超媒體系統(tǒng)在初始化階段,分析用戶在使用這樣的系統(tǒng)之前的掌握程度,一般是通過一組或幾組問題進行測試。如果測試的問題過多,用戶對于系統(tǒng)的興趣就會受到影響,因此大部分的系統(tǒng)在初始化測試時,所采用的問題一般非常有限,這樣對于用戶領(lǐng)域知識的初始化程度就無法很準(zhǔn)確的評估。
(2)用戶的瀏覽動作與知識掌握程度之間關(guān)系的不確定性。雖然系統(tǒng)能夠精確記錄下用戶與超媒體系統(tǒng)交互的動作的時間,但是,對每一個用戶而言,完成閱讀每一個信息節(jié)點的“合適”的時間是無法確切衡量的。一種方法是通過其他途徑獲得每一個用戶的閱讀速度,但這不是所有系統(tǒng)能夠獲取的信息。
(3)用戶的瀏覽動作和目標(biāo)的聯(lián)系的不確定性。認知心理學(xué)的研究成果表明,這種不確定尤其表現(xiàn)在用戶初期使用系統(tǒng)的時候,出于好奇心理,嘗試瀏覽可能和他本身不感興趣的內(nèi)容。而這些動作有可能對系統(tǒng)在預(yù)測用戶的瀏覽目標(biāo)時帶來不利的影響。
2貝葉斯網(wǎng)絡(luò)
貝葉斯網(wǎng)絡(luò)是一個概率推理機制,它在概率論的基礎(chǔ)上進行不確定推理。貝葉斯網(wǎng)絡(luò)為在某一特定應(yīng)用領(lǐng)域中描述隨機變量之間的概率獨立性提供了一個圖形化的表達方式,以及利用這些獨立進行復(fù)雜的概率推理的算法…。
2.1貝葉斯網(wǎng)絡(luò)的定義
貝葉斯網(wǎng)絡(luò)又稱為信念網(wǎng)絡(luò),是一種圖型化的模型,能夠圖形化地表示一組變量間的聯(lián)合概率分布函數(shù)。一個貝葉斯網(wǎng)絡(luò)包括了一個結(jié)構(gòu)模型和與之相關(guān)的一組條件概率分布函數(shù)。結(jié)構(gòu)模型是一個有向無環(huán)圖,其中的節(jié)點表示了隨機變量,是對于過程、事件、狀態(tài)等實體的某特性的描述,邊則表示變量間的概率依賴關(guān)系。圖中的每個節(jié)點都有一個給定其父節(jié)點情況下該節(jié)點的條件概率分布函數(shù)。這樣,一個貝葉斯網(wǎng)絡(luò)就用圖形化的形式表示了如何將與一系列節(jié)點相關(guān)的條件概率函數(shù)組合成為一個整體的聯(lián)合概率分布函數(shù)J。具體定義如下:
定義:設(shè)V={x,x2……X}是值域u上的n個隨機變量,則值域U上的貝葉斯網(wǎng)絡(luò)BN(B。,B),其中:
(1)B|=(V,E)是一個定義在V上的有向無環(huán)圖(DAG),V是該DAG的節(jié)點集,E是該DAG的邊集。如果存在一條節(jié)點Xi到節(jié)點X的有向邊,則稱Xi是Xi的父節(jié)點,Xi是Xi的子節(jié)點。記Xi的所有父節(jié)點為誠。
(2)Bp={P()(il)6-[0,1]}lxi∈V,對于V中的每個節(jié)點,定義了一組條件概率分布函數(shù)P(Xl)∈[0,1]。
由貝葉斯網(wǎng)絡(luò),利用貝葉斯公式,我們很容易得到X的全概率分布函數(shù):
P(x)=P(x。,x2……XⅡ)=liP(Xl),誠是Xi的所有父節(jié)點。
2.2貝葉斯網(wǎng)絡(luò)的優(yōu)化
貝葉斯網(wǎng)絡(luò)的主要用途是進行概率推理。在已知網(wǎng)絡(luò)中某些節(jié)點概率值的情況下,利用貝葉斯網(wǎng)絡(luò)計算可以獲得其它節(jié)點的條件概率。這種推理可以形象的稱為條件概率的“傳播”。然而,一般的貝葉斯網(wǎng)絡(luò)推理都存在一個“NP—Hard”問題J。當(dāng)貝葉斯網(wǎng)絡(luò)中不存在無向環(huán)的結(jié)構(gòu)時,可以找到多項式時間算法,為了將一般的貝葉斯網(wǎng)絡(luò)改造為不含無向環(huán)的貝葉斯網(wǎng)絡(luò),通常采用以下兩種方法。
(1)聚簇。如圖l所示,將圖中的節(jié)點B和C合并成一個節(jié)點,從而消除圖l(a)中的有向環(huán),這種方法稱作聚簇。
(2)條件分割。設(shè)變量A的取值范圍為:A。,A2,…,,則將原來的貝葉斯網(wǎng)絡(luò)分割成n個網(wǎng)絡(luò),分別是A=A。,A=A2,…,A:。這種方法稱作分割,如圖2所示。
(3)貝葉斯網(wǎng)絡(luò)舉例。圖3顯示了一個貝葉斯網(wǎng)絡(luò)的例子,它模型化了下述的二進制變量:變量a表示病人的年齡大于75歲,變量b表示病人需要戴眼鏡,變量c表示病人眼中出現(xiàn)晶狀體,變量v表示病人的視力由于瞇眼而有所提高,變量s表示病人抱怨視力差,變量r表示病人的視網(wǎng)膜反射可察覺。在這個貝葉斯網(wǎng)絡(luò)中,變量a與b之間的弧表明相對于其它變量,a與g是直接依賴的。變量a與s之間沒有弧相連,它們是通過變量b與C而發(fā)生依賴關(guān)系。
變量間依賴的強弱由條件概率分布函數(shù)Bp量化。例如,當(dāng)a為真,b為真的概率為P(b=TIa=T)=0.75。當(dāng)給定了變量的父節(jié)點的值后,該變量為假的條件概率可以從此變量為真的條件概率中推導(dǎo)出來,在此就沒有給出。
3自適應(yīng)超媒體系統(tǒng)中貝葉斯網(wǎng)絡(luò)的構(gòu)造
一個貝葉斯網(wǎng)絡(luò)由網(wǎng)絡(luò)結(jié)構(gòu)表示其定性部分,由條件概率分布函數(shù)表示其定量部分。這兩部分必須加以指明以構(gòu)成一個貝葉斯網(wǎng)絡(luò),之后在一個系統(tǒng)中被用作推導(dǎo)引擎。在超媒體系統(tǒng)中,構(gòu)造貝葉斯網(wǎng)絡(luò)分為四個階段。
(1)定義域變量。在某一領(lǐng)域,確定需要哪些變量描述該領(lǐng)域的各個部分,以及每個變量的確切含義。
(2)確定網(wǎng)絡(luò)結(jié)構(gòu)。由專家確定各個變量之間的依賴關(guān)系,從而獲得該領(lǐng)域內(nèi)的網(wǎng)絡(luò)結(jié)構(gòu)。在確定網(wǎng)絡(luò)結(jié)構(gòu)時必須注意要防止出現(xiàn)有向環(huán)。
(3)確定條件概率分布函數(shù)。通過由專家確定的網(wǎng)絡(luò)結(jié)構(gòu)中每個變量的條件概率分布函數(shù),量化變量之間的依賴關(guān)系。
(4)應(yīng)用到實際系統(tǒng)。運用到實際系統(tǒng)中,利用系統(tǒng)搜集的數(shù)據(jù),經(jīng)過計算和分析,調(diào)整貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)和各變量的條件概率分布函數(shù),對貝葉斯網(wǎng)絡(luò)進行優(yōu)化。
在實際應(yīng)用中,在每一個階段之后,都要進行評估,考察前面的階段是否被成功地執(zhí)行。每當(dāng)發(fā)現(xiàn)前面階段所得的結(jié)論不充分時,前一個階段將被再次執(zhí)行,否則,前進到下一階段。每個階段發(fā)生的錯誤應(yīng)被及時更正,在早期產(chǎn)生的錯誤若在后期加以更正將比在早期更正花費更大的代價。我們稱重復(fù)經(jīng)歷某個階段并進行評估的過程為建立一測試期(budd—textcycle),據(jù)此,我們構(gòu)建了自適應(yīng)超媒體系統(tǒng)貝葉斯網(wǎng)絡(luò)構(gòu)造生命周期圖,如圖4所示。
在某一特定領(lǐng)域構(gòu)造貝葉斯網(wǎng)絡(luò)是一件非常困難并且也費時的工作。這種困難一方面來自于某些領(lǐng)域過于復(fù)雜,即使該領(lǐng)域的專家也無法完全正確的描述該領(lǐng)域的因果關(guān)系,這影響了貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)造;而另一方面,人們擅長于描述定性的關(guān)系,而不擅長描述定量的關(guān)系,這直接造成了在確定條件概率分布函數(shù)時的困難。
利用數(shù)據(jù)庫中的大量原始數(shù)據(jù),經(jīng)過計算、分析,自動構(gòu)造貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)和條件概率分布函數(shù)的方法,是一個能夠有效降低貝葉斯網(wǎng)絡(luò)構(gòu)造工作量的途徑,這方面的研究成為貝葉斯網(wǎng)絡(luò)學(xué)習(xí)問題,最近幾年,研究者提出了許多自動學(xué)習(xí)貝葉斯網(wǎng)絡(luò)的算法,在此不再贅述。
4結(jié)語
超媒體系統(tǒng)中存在著眾多的不確定因素,這促使研究者求助于概率理論中的貝葉斯網(wǎng)絡(luò)方法,并由此發(fā)展成為目前人工智能領(lǐng)域中研究日益廣泛的一個分支一貝葉斯網(wǎng)絡(luò)。貝葉斯網(wǎng)絡(luò)為超媒體系統(tǒng)提供了一種有效的推理機制,但是如何根據(jù)超媒體系統(tǒng)的特點構(gòu)造一個有效、準(zhǔn)確的貝葉斯網(wǎng)絡(luò)將成為今后發(fā)展的重點。
看過《貝葉斯網(wǎng)絡(luò)在智能信息處理|貝葉斯網(wǎng)絡(luò)在自適應(yīng)超媒體系統(tǒng)中應(yīng)用研究論文》的人還看了以下文章