久久精品水蜜桃av综合天堂,久久精品丝袜高跟鞋,精品国产肉丝袜久久,国产一区二区三区色噜噜,黑人video粗暴亚裔
站長(zhǎng)百科 | 數(shù)字化技能提升教程 數(shù)字化時(shí)代生存寶典
首頁
數(shù)字化百科
電子書
建站程序
開發(fā)
服務(wù)器
辦公軟件
開發(fā)教程
服務(wù)器教程
軟件使用教程
運(yùn)營教程
熱門電子書
WordPress教程
寶塔面板教程
CSS教程
Shopify教程
導(dǎo)航
程序頻道
推廣頻道
網(wǎng)賺頻道
人物頻道
網(wǎng)站程序
網(wǎng)頁制作
云計(jì)算
服務(wù)器
CMS
論壇
網(wǎng)店
虛擬主機(jī)
cPanel
網(wǎng)址導(dǎo)航
WIKI使用導(dǎo)航
WIKI首頁
最新資訊
網(wǎng)站程序
站長(zhǎng)人物
頁面分類
使用幫助
編輯測(cè)試
創(chuàng)建條目
網(wǎng)站地圖
站長(zhǎng)百科導(dǎo)航
站長(zhǎng)百科
主機(jī)偵探
IDCtalk云說
跨境電商導(dǎo)航
WordPress啦
站長(zhǎng)專題
網(wǎng)站推廣
網(wǎng)站程序
網(wǎng)站賺錢
虛擬主機(jī)
cPanel
網(wǎng)址導(dǎo)航專題
云計(jì)算
微博營銷
虛擬主機(jī)管理系統(tǒng)
開放平臺(tái)
WIKI程序與應(yīng)用
美國十大主機(jī)
編輯“
搜索引擎工作原理
”
人物百科
|
營銷百科
|
網(wǎng)賺百科
|
站長(zhǎng)工具
|
網(wǎng)站程序
|
域名主機(jī)
|
互聯(lián)網(wǎng)公司
|
分類索引
跳轉(zhuǎn)至:
導(dǎo)航
、?
搜索
警告:
您沒有登錄。如果您做出任意編輯,您的IP地址將會(huì)公開可見。如果您
登錄
或
創(chuàng)建
一個(gè)賬戶,您的編輯將歸屬于您的用戶名,且將享受其他好處。
反垃圾檢查。
不要
加入這個(gè)!
==探尋蜘蛛和機(jī)器人== 搜索引擎要知道網(wǎng)上的新生事物,就得派人出去收集,每天都有新的網(wǎng)站產(chǎn)生,每天都有網(wǎng)站內(nèi)容的更新,而且這些產(chǎn)生的網(wǎng)站數(shù)量、更新的網(wǎng)站內(nèi)容是爆炸式的,靠人工是不可能完成這個(gè)任務(wù)的,所以搜索引擎的發(fā)明者就設(shè)計(jì)了計(jì)算機(jī)程序,派它們來執(zhí)行這個(gè)任務(wù)。<br> 探測(cè)器有很多叫法,也叫Crawler(爬行器)、spider([[蜘蛛]])、robot([http://www.kktzf.com.cn/wiki/%E8%9C%98%E8%9B%9B 機(jī)器人])。這些形象的叫法是描繪搜索引擎派出的蜘蛛機(jī)器人爬行在互聯(lián)網(wǎng)上探測(cè)新的信息,Google把它的探測(cè)器叫做[http://www.kktzf.com.cn/wiki/%E8%9C%98%E8%9B%9B Googlebot],百度就叫[http://www.kktzf.com.cn/wiki/%E8%9C%98%E8%9B%9B Baiduspider],Yahoo稱為[http://www.kktzf.com.cn/wiki/%E8%9C%98%E8%9B%9B Slurp],無論它們叫什么,它們都是人們編制的計(jì)算機(jī)程序,由它們不分晝夜的訪問各個(gè)網(wǎng)站,取回網(wǎng)站的內(nèi)容、標(biāo)簽、圖片等,然后依照搜索引擎的算法給它們定制索引。 [http://www.kktzf.com.cn/wiki/%E8%9C%98%E8%9B%9B 網(wǎng)絡(luò)蜘蛛]通過網(wǎng)頁的鏈接地址來尋找網(wǎng)頁,從網(wǎng)站某一個(gè)頁面(通常是首頁)開始,讀取網(wǎng)頁的內(nèi)容,找到在網(wǎng)頁中的其它鏈接地址,然后通過這些鏈接地址尋找下一個(gè)網(wǎng)頁,這樣一直循環(huán)下去,直到把這個(gè)網(wǎng)站所有的網(wǎng)頁都抓取完為止。如果把整個(gè)互聯(lián)網(wǎng)當(dāng)成一個(gè)網(wǎng)站,那么網(wǎng)絡(luò)蜘蛛就可以用這個(gè)原理把互聯(lián)網(wǎng)上所有的網(wǎng)頁都抓取下來。<BR> 當(dāng)抓取到這些網(wǎng)頁后,由分析索引系統(tǒng)程序?qū)κ占貋淼木W(wǎng)頁進(jìn)行分析,提取相關(guān)網(wǎng)頁信息(包括網(wǎng)頁所在[[URL]]、編碼類型、頁面內(nèi)容包含的所有關(guān)鍵詞、關(guān)鍵詞位置、生成時(shí)間、大小、與其它網(wǎng)頁的鏈接關(guān)系等),根據(jù)一定的相關(guān)度算法進(jìn)行大量復(fù)雜計(jì)算,得到每一個(gè)網(wǎng)頁針對(duì)頁面文字中及超鏈中每一個(gè)關(guān)鍵詞的相關(guān)度(或重要性),然后用這些相關(guān)信息建立網(wǎng)頁索引數(shù)據(jù)庫。<BR> 建立網(wǎng)頁索引數(shù)據(jù)庫后,當(dāng)用戶輸入[[關(guān)鍵詞]]搜索,由搜索系統(tǒng)程序從網(wǎng)頁索引數(shù)據(jù)庫中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁。因?yàn)樗邢嚓P(guān)網(wǎng)頁針對(duì)該關(guān)鍵詞的相關(guān)度早已算好,所以只需按照現(xiàn)成的相關(guān)度數(shù)值排序,相關(guān)度越高,排名越靠前。 <BR> 最后,由檢索器將搜索結(jié)果的鏈接地址和頁面內(nèi)容摘要等內(nèi)容組織起來,返回給用戶。 ==如何辨別搜索引擎機(jī)器人身份== 搜索引擎派出他們的搜索機(jī)器人去訪問、索引網(wǎng)站內(nèi)容,網(wǎng)站管理員也默認(rèn)、歡迎它們來訪。但是由于搜索引擎派機(jī)器人來訪會(huì)在一定程度上影響網(wǎng)站性能,因此并非所有的機(jī)器人都是無害的,有一些非法機(jī)器人偽裝成主流[[搜索引擎]]漫游器對(duì)網(wǎng)站大量遍歷,并且不遵循[[robots.txt]]規(guī)范,會(huì)嚴(yán)重拖垮網(wǎng)站性能而又無其它益處。因此,網(wǎng)站管理員需要驗(yàn)證每個(gè)機(jī)器人身份是否合法。 <br> 在你的[[服務(wù)器]]日志文件中,可見每次訪問的路徑和相應(yīng)的IP地址,如果是機(jī)器人來訪,則user-agent會(huì)顯示Googlebot或MSNBot等搜索引擎漫游器名稱,每個(gè)搜索引擎都有自己的user-agent,但僅有這個(gè)還不足以證明這個(gè)機(jī)器人的合法性,因?yàn)楹芏嗬圃煺呖赡軐⑺麄兊臋C(jī)器人也命名為Googlebot,以偽裝蒙混進(jìn)入網(wǎng)站,大肆采掘內(nèi)容。 <br> 目前,主流搜索引擎都建議網(wǎng)站管理員通過這種方式來辨別真實(shí)的機(jī)器人身份:通過[[DNS]]反向查詢找出搜索引擎[[http://www.kktzf.com.cn/wiki/%E8%9C%98%E8%9B%9B 機(jī)器人]]IP地址對(duì)應(yīng)的主機(jī)名稱;用主機(jī)名查找IP地址以確認(rèn)該主機(jī)名與IP地址匹配。 <br> 首先,使用DNS反向查詢(Reverse DNS Lookup),找出機(jī)器人IP地址對(duì)應(yīng)的主機(jī)名稱。主流搜索引擎的主機(jī)名稱通常情況下應(yīng)是這樣的: *Google:主機(jī)名稱應(yīng)包含于googlebot.com域名中,如:crawl-66-249-66-1.googlebot.com; *MSN:主機(jī)名稱應(yīng)包含于search.live.com域名中,如:livebot-207-46-98-149.search.live.com; *Yahoo:主機(jī)名稱應(yīng)包含于inktomisearch.com域名中,如:ab1164.inktomisearch.com。 最后,做一次DNS查詢,用主機(jī)名查找IP地址(Forward DNS Lookup),以確認(rèn)該主機(jī)名與IP地址匹配。由此證明該機(jī)器人是合法的。 <br> 現(xiàn)在,如果發(fā)現(xiàn)一個(gè)機(jī)器人將自己偽裝成合法搜索引擎漫游器,你就可以通過服務(wù)器上的設(shè)置來阻止這個(gè)非法機(jī)器人。 ==如何吸引蜘蛛== 分析一下,要想蜘蛛經(jīng)常光顧自己的站,首先要先把蜘蛛引過來。怎么引?最簡(jiǎn)單的辦法是你自己創(chuàng)造個(gè)關(guān)鍵字,注意要保證關(guān)鍵字的唯一性,百度搜索到的結(jié)果相關(guān)性要低。那關(guān)鍵字要在你首頁出現(xiàn),而且有相關(guān)解釋,目的是圍繞關(guān)鍵字做相關(guān)內(nèi)容。 然后去[[搜索引擎]]更新快的地方,發(fā)布相關(guān)信息。你發(fā)表的文章要圍繞你創(chuàng)造的關(guān)鍵字寫,關(guān)鍵字可以使用一兩次加粗,色彩,或者下劃線等,關(guān)鍵字連接到你首頁地址,內(nèi)容里再加一兩次你首頁地址(傳說中的軟文)。 最關(guān)鍵字加好了,信息也發(fā)布了,最關(guān)鍵的就是要觸發(fā)搜索引擎檢測(cè)數(shù)據(jù)庫,使[[蜘蛛]]會(huì)順著那些新內(nèi)容找到你首頁!怎么觸發(fā)?還用問嗎?剛做的關(guān)鍵字,具有唯一性,而且相關(guān)性低。如果有人搜索那關(guān)鍵字,蜘蛛檢索時(shí)候會(huì)優(yōu)先考慮最合適的頁面,也許搜索引擎暫時(shí)沒顯示收錄你的站,但是蜘蛛肯定已經(jīng)聞風(fēng)而動(dòng)了。 原理已經(jīng)介紹了,吸引蜘蛛還有許多方法,簡(jiǎn)單的總結(jié)一下: 一、增加原創(chuàng)的文字,適當(dāng)圍繞關(guān)鍵字優(yōu)化,強(qiáng)烈建議在title里也加一下。這里的原創(chuàng)不是說純自己寫的就完事了,你還要搜索一下別人是不是寫過類似的,如果有勸你還是另換話題吧。二、在百度權(quán)重高,更新快的地方發(fā)布圍繞關(guān)鍵字相關(guān)內(nèi)容的信息和你站點(diǎn)連接,讓百度蜘蛛能夠從多個(gè)地方轉(zhuǎn)到你的站上去。我常用的有百度知道、貼吧以及各大網(wǎng)摘。 三、圍繞這個(gè)關(guān)鍵字進(jìn)行推廣,發(fā)布大量外鏈,讓檢索結(jié)果定位到你的站。 ==相關(guān)條目== *[[搜索引擎]] *[[SEO術(shù)語]] [[category:搜索引擎 |S]]
摘要:
請(qǐng)注意,您對(duì)站長(zhǎng)百科的所有貢獻(xiàn)都可能被其他貢獻(xiàn)者編輯,修改或刪除。如果您不希望您的文字被任意修改和再散布,請(qǐng)不要提交。
您同時(shí)也要向我們保證您所提交的內(nèi)容是您自己所作,或得自一個(gè)不受版權(quán)保護(hù)或相似自由的來源(參閱
Wordpress-mediawiki:版權(quán)
的細(xì)節(jié))。
未經(jīng)許可,請(qǐng)勿提交受版權(quán)保護(hù)的作品!
取消
編輯幫助
(在新窗口中打開)
取自“
http://www.kktzf.com.cn/wiki/搜索引擎工作原理
”