久久精品水蜜桃av综合天堂,久久精品丝袜高跟鞋,精品国产肉丝袜久久,国产一区二区三区色噜噜,黑人video粗暴亚裔

采集

來自站長百科
跳轉(zhuǎn)至: 導航、? 搜索

采集,這里的采集指的是網(wǎng)站內(nèi)容的采集,故又稱為:網(wǎng)站采集。網(wǎng)站采集是一種網(wǎng)站內(nèi)容編輯模式。采集是復制粘貼的升級,指利用工具,按照一定的規(guī)則,定時或一次性批量的復制其他網(wǎng)站的內(nèi)容。采集一般的步驟是設置采集規(guī)則,采集目標網(wǎng)站,然后程序去自動抓取內(nèi)容,寫入網(wǎng)站數(shù)據(jù)庫。采集與離線瀏覽器下載不同,離線瀏覽器只是把網(wǎng)站所有的內(nèi)容下載到本地硬盤,而采集只抓取有用的內(nèi)容,然后一般是寫入網(wǎng)站數(shù)據(jù)庫,和網(wǎng)站是一體的,就像是一個機器人自動的為你的網(wǎng)站添加內(nèi)容。

采集的方式[ ]

采集一般用如下方式:

CMS自帶采集系統(tǒng)[ ]

目前國內(nèi)幾大CMS系統(tǒng)都自帶采集模塊,例如 動易 帝國CMS DedeCMS等等。

第三方采集軟件[ ]

有些專門開發(fā)的采集軟件,典型的有火車頭采集器。

采集的優(yōu)缺點[ ]

優(yōu)點:

  • 自動添加網(wǎng)站內(nèi)容,維護成本低
  • 可在短期內(nèi)迅速增加網(wǎng)站內(nèi)容

缺點:

  • 涉及版權問題。目前國內(nèi)對這方面不重視,但是采集就是對所采集網(wǎng)站的勞動成果的竊取,如果一個網(wǎng)站一直依靠采集是無法發(fā)展壯大的
  • 服務器消耗資源大。如果是用CMS自帶模塊進行采集,采集之后生成靜態(tài)頁面,資源消耗是非常厲害的,所以不少主機商是禁止采集的。
  • 大量重復內(nèi)容,容易被搜索引擎懲罰
  • 可能遭到所采集網(wǎng)站的各種報復,例如起訴,攻擊等等。

采集的版權及道德問題[ ]

  • 采集一般侵犯了對方網(wǎng)站的版權
  • 采集增加了對方服務器的資源消耗,如果對方是個人網(wǎng)站,使用的是虛擬主機,很可能引起資源消耗太大,被主機商關閉空間
  • 采集竊取了對方的勞動成果,并且在搜索引擎等地方與對方形成競爭關系