說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732
全網監測海量數據按需發布監測預警
實時把握輿情動態精準追溯信息源頭
想必很多的seoer每天都掙扎在偽原創的路上,改頭改尾改標題,然后30%-50%的原創。當然我并不同意用什么nai盤工具去代替人工的這個過程,因為現有的工具只有簡單的替換相近詞,生成的內容前后不通。可是做偽原創本身是個很艱辛的過程,寫出來的內容很多新手編輯心理沒底,也許能做到迎合閱讀者的口味,但過往矯正的修改又可能達不到推廣某個關鍵詞的目的。所以我們需要去了解搜索引擎如何去判斷這一相關性,不然修改或者關鍵詞的堆砌只能是畫蛇添足。
先看以下的兩組標題,請問,他們是相關的嗎?
1、悼念喬布斯-一個時代的落幕
2、蘋果價格會不會下跌?
其實也不是我說了算,是不是相關要基于搜索引擎的大數據分析。
搜索引擎通過大量的抓取文章的內容來判斷這些分詞之間的關系,并賦予其相關性的分值。(傳送門:什么是中文分詞?)
例如搜索引擎大量分析了其索引數據庫后發現某一個詞的內容有以下的分詞會和它有相關性的特點:(下面數據屬于假設)
p(某分詞|相關詞庫)=相關性數值越高越相關,反之不相關
p(iPhone|蘋果公司)=0.2
p(喬布斯|蘋果公司)=0.15
p(Surface pro|蘋果公司)=0.00001
p(Windows 8|微軟)=0.2
通過數據研究,人們相信百度搜索引擎擁有這么一個詞庫,然后把相關的詞分配到各個詞庫下用來匹配文字中的內容,從而得出這篇文章所表達的含義。如上面的假設一樣,通過大量的數據分析,機器通過分詞后能判斷iPhone、喬布斯、蘋果等在合適語境中屬于“蘋果公司”的詞庫下,windows產品、office辦公等屬于“微軟”的詞條下面。當出現歧義的時候,會通過上下文的結果來判斷。像第二個標題一樣,如果判斷是屬于蘋果公司的詞庫下,那這兩組標題是相關的,喬布斯去世->蘋果價格波動,這個屬于內在的聯系;當僅僅是水果的價格問題,那沒有相關性。
下面舉個淺顯的例子:
百度和必應這兩家搜索引擎市場競爭對手的握手言和,將進一步鞏固百度在中國搜索引擎市場的地位,同時將使得谷歌在華業務的發展更為艱難。此外,這一舉動也是百度為拓展海外業務、特別是英文搜索市場業務做技術準備,表明百度在框計算的進程中又向前邁進了一步。
你覺得這篇文章的主要講了什么?(怎么感覺和公務員申論有點像)
為了便于理解,請看圖片中,不要糾結有些類似“搜索引擎”為什么沒被分詞,為什么英文搜索一定是谷歌詞庫下,只是舉個例子,
根據終的分詞和語境可以判斷出,這段內容是關于百度市場的。
所以有時候些軟文并不是關鍵詞越多越好,自己寫的一定有質量。特別是沒有品牌效應的工業產品的時候,很有可能一不小心寫偏了,變成了其他的主題內容,與自己的關鍵詞無關。這告訴了 我們,我們所創造的內容要以用戶需求的角度出發,不然大量的偏離主旨的偽原創內容,很有可能將投票頁面相關性的分數拉低了。
推薦閱讀
百度搜索研發部:淺談互聯網頁面價值 | 文軍營銷首先,互聯網上的頁面是無窮盡的,而搜索引擎的硬件資源是有限的,想用有限的資源去覆蓋無窮盡的互聯網,我們需要對頁面價值做出判斷,不收錄那些無檢索價值的頁面,少收錄那些檢索價值低的頁面。這是頁面價值在收錄控制方面的應用。 第二,搜索引擎spider的抓取能力是有限的,出于訪問友好性的考慮,對于一個網站或一個IP抓取...淺談URL優化該怎么寫,如何判斷重要性@steven | 文軍營銷1.URL一致性:URL 一致性是一個非常重要的指標,推薦大家一本書《走進搜索引擎》里面有介紹spider是一種機器程序,而非人腦,雖然也有學習的過程,但是國內網站千千萬,每個網站有不同的url規范,你如果url命名規則雜亂無章spider又怎能的辨別你的內容規范? 這里舉個個人覺得做的比較好的case:“吧”。讀者可以去翻閱吧...
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732