美女高潮潮喷出白浆视频,欧美村妇激情内射,日本少妇被爽到高潮无码,CHINESE猛男自慰GV

當前位置:100EC>信息圖>淺析網絡教育搜索引擎的智能化排序研究
淺析網絡教育搜索引擎的智能化排序研究
發(fā)布時間:2011年09月07日 10:30:24

(電子商務研究中心訊)  摘要:排序算法是現(xiàn)代搜索引擎的重要技術之一。本文根據(jù)網絡教育資源的特色以及網絡教育中學生的學習行為的特點提出了一種排序方法,即利用智能代理技術通過對學生學習行為的個人興趣模型的構建,以使搜索更為智能化和個性化。

  搜索引擎的排序算法就是當用戶輸入查詢關鍵詞后,迅速在索引庫中檢索出文檔,并將文檔按照一定的規(guī)則進行合理排序,以使用戶需要的文檔盡可能排在前面幾頁,以便用戶能快速查詢到自己需要的信息。

  對于基于關鍵詞檢索的搜索引擎,通過Robot收集并索引的信息資源量非常龐大,比如Google可以搜索的網頁高達33億頁。當用戶進行搜索時,系統(tǒng)往往回返回數(shù)量巨大的檢索結果,增加用戶的負擔,也降低了搜索引擎的效率,因此排序算法研究在搜索引擎中占有一種核心的地位。

  一、現(xiàn)代搜索引擎的排序技術

  1.1傳統(tǒng)搜索引擎的排序技術

  傳統(tǒng)搜索引擎的排序算法是對提取的每個關鍵詞賦予一個權值,表示該網頁與關鍵詞之間的相關程度,不同的搜索引擎在計算權值時使用了不同的方法,但它們都以關鍵詞在網頁中出現(xiàn)的位置和頻率為基本依據(jù):

  1、關鍵詞出現(xiàn)在標題中的網頁可能比只出現(xiàn)在其它地方的網頁更符合要求;

  2、關鍵詞出現(xiàn)在網頁的前面可能比只出現(xiàn)在網頁的后面更符合要求;

  3、同一個關鍵詞的出現(xiàn)多次的網頁又可能比只出現(xiàn)一兩次的網頁更符合要求;

  把這些因素綜合起來考慮便可得出一個計算關鍵詞權值的公式。

  然而這種排序算法卻有其局限性,由于網絡資源的數(shù)量巨大,權值相同的兩個網頁質量卻可能相差很遠,而且很多網頁設計者為了使網頁能排在檢索結果的前面,在其頁面上堆砌關鍵詞,或在重要的位置放置和網頁內容無關卻很流行的詞匯,以達到增加瀏覽量的結果。

  1.2現(xiàn)代搜索引擎的排序技術

  現(xiàn)代搜索引擎為了達到較好的檢索結果都使用新的基于超鏈分析的排序技術。其中以L.Page等提出的PageRank最為經典。PageRank算法由于在Google中得到成功的應用而被美國《時代》雜志評為“1999年度十大網絡技術”之一。

  1、PageRank算法

  PageRank使利用網絡自身的超鏈接結構給所有的網頁確定一個重要性的等級數(shù)[1],當從網頁A鏈接到網頁B時,就認為“網頁A投了網頁B一票”,從而增加了網頁B的重要性,最后根據(jù)網頁的得票數(shù)評定其重要性,以此來幫助實現(xiàn)排序算法的優(yōu)化。同時PageRank還要分析為其投票的網頁的重要性,重要的網頁所投之票有助于增強其他網頁的“重要性”,也就是說網頁的重要性決定著同時也依賴于其他網頁的重要性,而這個重要性的量化指標就叫PageRank值。

  2、算法的實現(xiàn)

  當搜索引擎接受到用戶的關鍵詞提問后,對提問式進行分析并從索引庫中找到和搜索關鍵詞匹配的所有網頁信息,然后通過排序系統(tǒng)對網頁進行相關性排序。

  3、PageRank算法的發(fā)展

  現(xiàn)在搜索引擎一般采用基于網頁內容分析和基于超鏈分析相結合的方法進行相關度分析,也就是排序系統(tǒng)將網頁的PageRank值與文檔分詞后的信息以及鏈接文件中的網頁描述信息相結合起來確定檢索結果排序的權值,這樣就能客觀地對網頁進行排序,從而極大限度地保障搜索出來的結果與用戶的查詢相一致。

  二、網絡教育資源的特色對搜索引擎的要求

  網絡教育是建立在互聯(lián)網上的,但卻又不同于互聯(lián)網,主要表現(xiàn)在教育資源的特點和學生的行為方式上。

  2.1網絡教育資源的特點[2]

  同互聯(lián)網上的信息一樣,網絡教育資源在數(shù)量上也是巨大的。但是,不同的網絡教育資源分布雖廣,但其內容之間的關聯(lián)度和穩(wěn)定性卻是很強的,而且具有良好的可分類性。

  2.2學生學習行為的特點:

  網絡教育中的學生獲取知識的主要來源是從網絡中查詢自己需要的教育資源,但是學生不同于一般的網絡用戶,具有自己的特色:

  1、學生處于學習狀態(tài),對專業(yè)知識了解少;

  2、學生對網絡的駕馭能力差,具有一定的盲目性;

  3、對于海量的信息資源,學生往往缺少耐性,不容易找到自己所需要的知識。

  2.3對搜索引擎的查詢排序要求

  1、搜索引擎要能從學生的查詢語言中提煉出學生的查詢要求,并能更加知識結構對查詢要求進行擴展聯(lián)想,對所需資源進行準確定位。

  2、搜索引擎要能根據(jù)每個學生的學習特點對其提供資源,要能建立學生的興趣“檔案”,確定學生的興趣范圍,以便更準確的將學生所需知識排在前面。

  三、一種基于興趣模型的排序方法研究

  3.1學科知識結構的構建

  在網絡教育環(huán)境中,學科領域知識的分類是相對穩(wěn)定而且準確的,因此首先以此為基礎構建一個學科知識分類結構[3],這個結構是用分類樹的方法建立各種學科知識概念之間的上下層關系,上層概念是其所有下層概念共同屬性的概括,下層概念則是對上層概念的細化。整個概念樹形成一個整體,每個概念節(jié)點都可以以學科分類代碼為基礎進行概念編碼標識,并且每個概念都帶有一個集合,是該概念同義但不同描述元素組成的集合。集合可以根據(jù)需要進行添加、刪除、修改等操作。每個概念可與其它概念建立相應的關系,這種關系是不同于分類中上下層關系的橫向關系。

  3.2興趣模型的建立

  對于學生來說,其學習行為基本上是在本學科范圍之內的,因此其興趣范圍較一般用戶穩(wěn)定,同時每個學生根據(jù)自身的學習特點不同,對知識概念以及概念之間的理解也不相同,這就構成了每個學生的個人興趣所在。因此可以通過智能代理系統(tǒng)根據(jù)學生所表現(xiàn)出的興趣趨向去構建學生的興趣模型。

  1、智能代理系統(tǒng)的研究

  1)智能代理的特點[4]

  智能代理技術是人工智能研究的新成果,是信息世界種的軟件機器人。它是代表用戶或其他程序,以主動方式完成一組操作的機動計算實體。智能代理的特點是具有不斷學習增長智能、適應信息和用戶興趣動態(tài)變化的能力,從而提供個性化的服務。

  2)網絡教育中的智能興趣代理

  智能興趣代理[5]是通過對學生學習行為的分析和研究,了解和掌握學生學習的情況、需求、能力、進度、興趣等,從而呈現(xiàn)符合個性的學習資源,使得每個學生身邊仿佛有了解針對自身特點進行教學的“老師”而獲得個性化的教學服務。其智能化的表現(xiàn)在于不斷學習,適應學生興趣動態(tài)變化的能力,從而實現(xiàn)查詢的個性化。

  智能興趣代理的基本思想是在概念樹的基礎上,通過學生對檢索結果的反饋信息,逐漸建立各概念節(jié)點的橫向聯(lián)系,采用對學生的學科概念子樹上的各節(jié)點及節(jié)點之間關系的等級計算,得到學生興趣點的概念和關聯(lián)等級排序。不僅可以得到學生感興趣的關鍵詞,還能得到學生所感興趣的一組相互有關聯(lián)的興趣詞,以此來確定學生的興趣趨向。

  2、興趣模型的建立

  當學生在第一次使用該搜索引擎系統(tǒng)時先進行基本信息的注冊,包括個人信息、學科信息等。系統(tǒng)根據(jù)學生的基本信息,將概念網中相應的學科類別記錄在學生的個人信息庫中。當學生提出查詢請求時,檢索模塊對學生的查詢請求進行概念擴展,并將檢索到的網頁按照與各關鍵詞的相關度進行排序,并將結果返回后,智能興趣代理開始對學生的反饋行為進行分析,這里可采用學生打分及分析學生行為模式的方式:

  1)由于學生瀏覽網頁時具有一定的盲目性和偶然性,需要學生對其瀏覽的網頁進行評分。興趣代理只關注評分及格以及學生進行下載或復制部分內容的網頁。對于這些網頁,興趣代理提取出詞頻大于一定值的領域詞,在學生的個人學科子樹上將這些領域詞之間加上關聯(lián)等級值。

  2)在學生對一次檢索結果進行遍歷后,將每個關聯(lián)邊的所有等級值相加,存入信息庫中。對學生的每一次檢索都重復上述過程,對關聯(lián)邊進行等級值的疊加。這樣經過疊加后,關聯(lián)邊的等級值越高,概念之間的關聯(lián)性越強,如果多個概念之間的關聯(lián)性都很強,則可認為反映了學生的興趣趨向,構建了學生的興趣模型。

  四、結束語

  隨著人工智能的發(fā)展,搜索引擎的智能化將會越來越符合人們的實際需求。尤其是在網絡教育快速發(fā)展的時期,應用智能代理來更深入的挖掘和分析學生的學習行為,監(jiān)控學生的日常學習活動對現(xiàn)代教育的發(fā)展都能起到強大的支持作用。(文/朱素媛  編選:網經社)

  參考文獻

  [1]曹軍, Google的PageRank技術剖析,情報雜志,2002.10,15-18

  [2]程智,《網絡教育基礎》人民郵電出版社2002.11

  [3]逢煥利等,基于概念檢索的中文搜索引擎,計算機工程,Vol.23,No1,Mar2002,8-10

  [4]李偉超,牛改芳,智能代理技術分析及應用,情報雜志,2003.6,29-33

  [5]馬秀芳,張小真等,一種基于agent技術的網上協(xié)作學習環(huán)境研究,CBE2001論文集-轉貼

浙江網經社信息科技公司擁有18年歷史,作為中國領先的數(shù)字經濟新媒體、服務商,提供“媒體+智庫”、“會員+孵化”服務;(1)面向電商平臺、頭部服務商等PR條線提供媒體傳播服務;(2)面向各類企事業(yè)單位、政府部門、培訓機構、電商平臺等提供智庫服務;(3)面向各類電商渠道方、品牌方、商家、供應鏈公司等提供“千電萬商”生態(tài)圈服務;(4)面向各類初創(chuàng)公司提供創(chuàng)業(yè)孵化器服務。

網經社“電數(shù)寶”電商大數(shù)據(jù)庫(DATA.100EC.CN,免費注冊體驗全庫)基于電商行業(yè)18年沉淀,包含100+上市公司、新三板公司數(shù)據(jù),150+獨角獸、200+千里馬公司數(shù)據(jù),4000+起投融資數(shù)據(jù)以及10萬+互聯(lián)網APP數(shù)據(jù),全面覆蓋“頭部+腰部+長尾”電商,旨在通過數(shù)據(jù)可視化形式幫助了解電商行業(yè),挖掘行業(yè)市場潛力,助力企業(yè)決策,做電商人研究、決策的“好參謀”。

【投訴曝光】 更多>

【版權聲明】秉承互聯(lián)網開放、包容的精神,網經社歡迎各方(自)媒體、機構轉載、引用我們原創(chuàng)內容,但要嚴格注明來源網經社;同時,我們倡導尊重與保護知識產權,如發(fā)現(xiàn)本站文章存在版權問題,煩請將版權疑問、授權證明、版權證明、聯(lián)系方式等,發(fā)郵件至NEWS@netsun.com,我們將第一時間核實、處理。

        平臺名稱
        平臺回復率
        回復時效性
        用戶滿意度
        微信公眾號
        微信二維碼 打開微信“掃一掃”
        微信小程序
        小程序二維碼 打開微信“掃一掃”