WIKI使用導航
站長百科導航
站長專題
- 網(wǎng)站推廣
- 網(wǎng)站程序
- 網(wǎng)站賺錢
- 虛擬主機
- cPanel
- 網(wǎng)址導航專題
- 云計算
- 微博營銷
- 虛擬主機管理系統(tǒng)
- 開放平臺
- WIKI程序與應用
- 美國十大主機
采集
來自站長百科
采集,這里的采集指的是網(wǎng)站內(nèi)容的采集,故又稱為:網(wǎng)站采集。網(wǎng)站采集是一種網(wǎng)站內(nèi)容編輯模式。采集是復制粘貼的升級,指利用工具,按照一定的規(guī)則,定時或一次性批量的復制其他網(wǎng)站的內(nèi)容。采集一般的步驟是設置采集規(guī)則,采集目標網(wǎng)站,然后程序去自動抓取內(nèi)容,寫入網(wǎng)站數(shù)據(jù)庫。采集與離線瀏覽器下載不同,離線瀏覽器只是把網(wǎng)站所有的內(nèi)容下載到本地硬盤,而采集只抓取有用的內(nèi)容,然后一般是寫入網(wǎng)站數(shù)據(jù)庫,和網(wǎng)站是一體的,就像是一個機器人自動的為你的網(wǎng)站添加內(nèi)容。
采集的方式[ ]
采集一般用如下方式:
CMS自帶采集系統(tǒng)[ ]
目前國內(nèi)幾大CMS系統(tǒng)都自帶采集模塊,例如 動易 帝國CMS DedeCMS等等。
第三方采集軟件[ ]
有些專門開發(fā)的采集軟件,典型的有火車頭采集器。
采集的優(yōu)缺點[ ]
優(yōu)點:
- 自動添加網(wǎng)站內(nèi)容,維護成本低
- 可在短期內(nèi)迅速增加網(wǎng)站內(nèi)容
缺點:
- 涉及版權問題。目前國內(nèi)對這方面不重視,但是采集就是對所采集網(wǎng)站的勞動成果的竊取,如果一個網(wǎng)站一直依靠采集是無法發(fā)展壯大的
- 服務器消耗資源大。如果是用CMS自帶模塊進行采集,采集之后生成靜態(tài)頁面,資源消耗是非常厲害的,所以不少主機商是禁止采集的。
- 大量重復內(nèi)容,容易被搜索引擎懲罰
- 可能遭到所采集網(wǎng)站的各種報復,例如起訴,攻擊等等。
采集的版權及道德問題[ ]
- 采集一般侵犯了對方網(wǎng)站的版權
- 采集增加了對方服務器的資源消耗,如果對方是個人網(wǎng)站,使用的是虛擬主機,很可能引起資源消耗太大,被主機商關閉空間
- 采集竊取了對方的勞動成果,并且在搜索引擎等地方與對方形成競爭關系