新聞資訊
新聞資訊
NEWS
|
搜索引擎工作原理搜索引擎工作過(guò)程非常復(fù)雜,接下來(lái)的幾節(jié)我們簡(jiǎn)單介紹搜索引擎是怎樣實(shí)現(xiàn)網(wǎng)頁(yè)排名的。這里介紹的內(nèi)容相對(duì)于真正的搜索引擎技術(shù)來(lái)說(shuō)只是皮毛,不過(guò)對(duì)大部分SEO人員已經(jīng)夠用了。 搜索引擎的工作過(guò)程大體上可以分成三個(gè)階段。 (1)爬行和抓取:搜索引擎蜘蛛通過(guò)跟蹤鏈接發(fā)現(xiàn)和訪問(wèn)網(wǎng)頁(yè),讀取頁(yè)面HTML代碼,存入數(shù)據(jù)庫(kù)。 (2)預(yù)處理:索引程序?qū)ψト?lái)的頁(yè)面數(shù)據(jù)進(jìn)行文字提取、中文分詞、索引、倒排索引等處理,以備排名程序調(diào)用。 (3)排名:用戶輸入查詢?cè)~后,排名程序調(diào)用索引庫(kù)數(shù)據(jù),計(jì)算相關(guān)性,然后按一定格式生成搜索結(jié)果頁(yè)面。 |