新聞動態基于內容作弊的垃圾網頁

       基于內容作弊的垃圾網頁。查詢關鍵詞與網頁相關度主要與查詢詞詞頻和查詢詞對應文檔數量的倒數成正比,所以作弊者往往針對這兩個因素入手制造垃圾網頁。他們往往會挑選一些很熱門的詞匯以吸引用戶的注意力,同時這些詞匯對應的資源往往又是正規網站稀缺的,以保證查詢詞對應文檔數量較少,例如“WIN10 免費下載”、“速度與激情7 免費觀看”等,將這些詞匯在頁面主體、標題和HTML頭重復的堆砌,以保證查詢詞詞頻較大。這種作弊方式被稱為關鍵詞堆砌,不過現在主流的搜索引擎幾乎都能識別單一使用這種方式制造的垃圾網頁了。

       還有一些垃圾網頁制作者利用一些自動化工具將搜索引擎搜索返回結果中的摘要信息抓取出來組成垃圾網頁的內容,使得其在內容上與關鍵詞有極高的相關度,達到欺騙的目的。不過隨著多數搜索引擎禁用了被抓取功能后,這種作弊方式也不多見了。另外一種作弊方式就是垃圾網頁制作者找一頁具有正常內容的網頁,將要作弊的關鍵詞稀稀拉拉相對均勻的混入夾雜其中,這種方式相對簡單的關鍵詞堆砌具有較大的迷惑性,如果網民不仔細閱讀或者搜索引擎沒有語義識別功能就很難識別出來。

       上面幾種作弊方式對于騙取廣告點擊,騙取訪問流量比較有用,但是對于一些本身以內容欺詐為目的的垃圾網頁還不能完全達到目的,因為網民在被騙進來之后很快就會關閉或者離開網頁。于是一種稱為偽裝型垃圾網頁的技術應運而生。它是指垃圾網頁的制造者通過技術手段分別為搜索引擎和用戶訪問的瀏覽器準備一個網頁的兩個版本。早期采取的技術包括利用CSS將堆砌的關鍵詞字號縮小、字體顏色透明或者與背景顏色一致等加以隱藏。而現在主要通過內容替換、重定向跳轉、Java Script腳本等技術進行偽裝。

本文地址:http://www.87juku.com/article/22556.html
相關文章:
最新文章:
日本毛x片免费视频观看视频_日本乱人伦av在线无码_日本加勒比无码av