您的位置:老鐵SEO > 站長新聞 >

織夢采集規則有哪些注意事項?

文章來源:www.kmkusn.tw

作者:老鐵SEO

人氣:127

2018-10-15

  在這個越來越浮躁的社會,越來越多的人期望事情能夠越來越輕松,越來越容易。特別是對于瞬息萬變的互聯網來說,需要時間去仔細琢磨的事情并不適合。就拿網站運營來說,完全的原創文章雖然對網站優化排名有很好的幫助,但大部分的網站運營的寫作能力并不高,再加上題材的限制、時間的規律性,希望完全通過原創及全手工來運營和優化一個網站是很困難的事情,特別是對于一些資訊類網站、商城類網站、視頻類網站等此類頁面較多、內容更新要求較快的網站來說,無論是內容建設還是外鏈發布都是個龐大而復雜的任務,靠手工完成無論是時間上還是成本上都不劃算。因而,有時候我們需要使用到一些工具的輔助。采集工具就是其中的一種。
 
  目前在網站采集中使用得比較多的采集工具是火車頭采集工具以及織夢自身的dede采集工具,采集工具之間的優劣對比網絡上有很多,百度一下你就知道,而織夢采集規則的設置網絡上也有很多攻略,大抵都差不多,因而本文也不再多加說明,有興趣的童鞋可以自行搜索看看。今天要跟大家分享的是,在設置織夢采集規則的時候,有哪些注意事項?
 
  一、采集起止代碼設置
 
  在織夢采集規則設置中,很重要的一個步驟就是采集起止代碼的設置。一般是一小段代碼,以“數字/英文+符號”形式為主。代碼越短越不容易出錯,并需要具有唯一性,以方便機器快速辨別采集的起止位置。在網上的教程中,這段起止代碼一般是完整的一段,如[內容],其中,是開始采集位置,[內容]代表需要采集的部分信息,是終止采集位置,很多人會誤以為起止代碼一定需要是完整的一段,但實際上并非如此。
 
  如下圖兩種:
 
  織夢采集規則有哪些注意事項?
 
  織夢采集規則有哪些注意事項?
 
  代碼的某一部分,或者甚至是夾雜中文的代碼也可以作為采集的起止代碼,這可以去掉一些網站內容開頭與結尾帶有網站專有標識。
 
  二、標題采集設置
 
  標題采集很簡單,有兩種方式,如下圖所示:
 
  織夢采集規則有哪些注意事項?
 
  在需要采集的頁面點擊右鍵選擇“查看源代碼”,在打開的頁面中使用快捷鍵Ctrl+F,在出現的搜索欄中輸入該采集內容的標題,就能查看到該頁面的標題規則,一般為title標簽以及H標簽,數量在1~4個不等。一般頁面會兩種標題標簽并存。這種情況下,使用H標簽會比title標簽采集更不容易出錯。
 
  需要注意的是,有時候H標簽有H1標簽H2標簽H3標簽等,一般只使用H1標簽。
 
  三、分頁織夢采集規則設置
 
  一些網站由于文章篇幅過長或者希望增加點擊率,往往把一篇文章分成幾個分頁來呈現。這種情況下采集的起止代碼就不在同一個頁面上,而應該在文章開始頁尋找采集開始代碼,而在文章結束頁尋找終止代碼,設置如下:
 
  織夢采集規則有哪些注意事項?
 
  四、幾個可能導致采集失敗的因素
 
  1、網站隱藏內容禁止采集。這種情況以騰訊新聞為例,騰訊新聞的內容在打開的源代碼頁面里不會呈現出來,因而也無法判別文章的起止位置,也無法采集到其網站內容。
 
  2、網站采集出錯。大多數網站內容在網頁以及代碼中都正常顯示,但當采集到目標網站時卻顯示出錯。這種出錯分為幾類:
 
  A、標題出錯。如下圖所示,文章的內容會全部集中到標題上。
 
  織夢采集規則有哪些注意事項?
 
  B、只采集到標題,內容空白。即無法采集到相關的內容。
 
  C、采集終止符失效,采集內容包括了被采集網站上的廣告/版權信息/版尾信息等信息。
 
  織夢采集規則有哪些注意事項?
 
  這些都是采集中經常會遇到的問題,了解這些,對于采集以及偽原創都有很大的幫助。雖然在優化上我們并不建議使用采集的方式,但在必要的情況下,了解織夢采集規則,對網站運營還是有一定的好處的。
相關文章

在線客服

外鏈咨詢

掃碼加我微信

0557-8818050

返回頂部

网球比分指数