欧美日韩在线视频精品一区二区|亚洲欧美一级夜夜夜夜爽W|日韩放荡少妇无码视频|亚洲国内自拍中文

蜘蛛是如何工作的


發(fā)布日期:2015-06-18

 

隨著搜索引擎的不斷更新和升級,搜索引擎的的收錄方式也在不斷的改變,作為一個seoer對搜索引擎的不斷更新,搜索蜘蛛搜索的搜索原理是務必要了解的。下面就由我們網站制作公司給大家講講當前搜索蜘蛛的工作原理吧,希望對大家有所幫助。

第一種是集中式網絡蜘蛛
集中式網絡蜘蛛的工作原理是:首先通過初始設定的種子URL爬取其所對應的Web頁面,通過蜘蛛的解析模塊從Web頁面中提取內容以及新的URL鏈接,保存新獲取的URL鏈接到指定URL集合中,以進行后續(xù)抓取任務。其突出特點是運行在某臺主機之上,從而開始訪問互聯網進行網頁抓取任務。早期實現的網絡蜘蛛大多采用這種工作方式,但是如今,隨著互聯網規(guī)模的急劇膨脹,集中式的網絡蜘蛛往往受限于軟硬件資源的限制,其釆集效率往往難以滿足業(yè)務的需求。
 
第二是分布式網絡蜘蛛
分布式網絡蜘蛛的工作運行原理實際上可以看作是多個集中式蜘蛛的協同合作,進而彌補了集中式網絡蜘蛛所存在的缺陷。分布式網絡蜘蛛包含多個子網絡蜘蛛,其分布性體現在這些蜘蛛可以分布在不同的地理位置,每個子蜘蛛在執(zhí)行抓取任務的過程中與單個集中式蜘蛛基本一致,同樣是從互聯網上下載Web頁面,并將網頁數據保存到本地文件系統(tǒng)中,從頁面中解析出新的URL,并按照這些URL的指向繼續(xù)爬行,從而不斷抓取頁面。分布式蜘蛛需要額外處理的是分割下載任務,并將分割的下載任務分配給各個子蜘蛛執(zhí)行,然后控制不同爬行器之間的數據交換,協調各個子蜘蛛的抓取進度。
海丰县| 酉阳| 会理县| 阆中市| 井研县| 冷水江市| 旬阳县| 新源县| 宁晋县| 武平县| 安泽县| 宣武区| 普安县| 齐河县| 合水县| 甘谷县| 安福县| 略阳县| 东辽县| 化州市| 内丘县| 佛坪县| 响水县| 中超| 桂平市| 凌云县| 都匀市| 五华县| 南通市| 南投市| 青岛市| 固安县| 涞源县| 武鸣县| 石景山区| 德昌县| 蓝山县| 东光县| 阜阳市| 天台县| 田东县|