“為了營造良好的搜索內(nèi)容生態(tài),保護搜索用戶的閱讀瀏覽體驗,保障優(yōu)質(zhì)內(nèi)容生產(chǎn)方在百度搜索中的權益,百度將于 9 月下旬對颶風算法進行升級。”
上周,我們發(fā)布了《百度搜索嚴厲打擊惡劣采集行為,將推出颶風算法 2.0》,今天我們詳細說明颶風算法 2.0 覆蓋的問題以及究竟應該怎么做。
颶風算法主要包含以下四類惡劣采集行為:
1、采集痕跡明顯
存在大量從其他網(wǎng)站或公眾號采集、搬運而來的內(nèi)容,信息未經(jīng)整合,排版混亂,部分功能缺失或文章可讀性差,有明顯采集痕跡,用戶閱讀感受很差。
示例(上圖左一)采集文章內(nèi)容中存在超鏈接不可點、功能缺失問題,采集痕跡明顯。
建議:對于網(wǎng)站會員發(fā)布內(nèi)容時需注意文章的排版和布局,不應出現(xiàn)與文章主旨不相關的信息或不可用的功能,干擾用戶的瀏覽。
2、內(nèi)容拼接
采集多篇不同文章進行拼接,整體內(nèi)容未形成完整邏輯,存在閱讀不通順、文章不連貫等問題,無法滿足用戶需求。
示例(上圖居中)前后內(nèi)容無關,邏輯不連貫。
建議:我們嚴厲反對利用采集編輯器等工具,隨意生產(chǎn)拼接采集抄襲內(nèi)容的行為,請會員多多發(fā)布對用戶有價值的原創(chuàng)內(nèi)容。
3、 存在大量采集內(nèi)容
指內(nèi)容多為直接采集搬運,盜取他人的勞動果實,自身無內(nèi)容生產(chǎn)力或內(nèi)容生產(chǎn)能力較差,信息內(nèi)容質(zhì)量較低、價值較小。
建議:我們鼓勵會員發(fā)布原創(chuàng)內(nèi)容,如若轉(zhuǎn)載需標明出處。(如:新聞、政策類等標明出處的轉(zhuǎn)載內(nèi)容,不會被認為是采集內(nèi)容)
4、跨領域采集
依靠采集抄襲大量與所屬領域不一致的內(nèi)容來獲取流量的行為。
示例(上圖居右)教育類發(fā)布美食相關內(nèi)容
建議:我們鼓勵會員發(fā)布相關領域內(nèi)的文章和內(nèi)容,通過領域?qū)W⒍全@得更多的搜索青睞。不要嘗試采集抄襲跨領域的內(nèi)容來獲得短期收益,這樣會造成領域?qū)W⒍鹊慕档停瑥亩绊懶畔⒃谒阉髦械谋憩F(xiàn)。
綜上,颶風算法 2.0 旨在保障搜索用戶的瀏覽體驗,保護搜索生態(tài)的健康發(fā)展、對于違規(guī)網(wǎng)站,百度搜索會依據(jù)問題的惡劣程度有相應的限制搜索展現(xiàn)的處理。
原文轉(zhuǎn)載自百度搜索資源平臺