本質上,谷歌聲稱其可通過更好地理解句子中單詞之間的關系來提高搜索結果。谷歌研究員兼搜索業(yè)務副總裁潘杜·納亞克(Pandu Nayak)表示,老版谷歌搜索算法將句子分解成“一連串的單詞”,并分析重要單詞的意思,從而給出簡單的本地搜索結果。而新的算法能夠理解上下文語境,進而給出更精確準確的結果。
谷歌調整后的搜索算法基于語言表達模型BERT,即“Bidirectional Encoder Representations from Transformers”的縮寫,它將句子作為整體來看待,更注重句子的整體意義。谷歌高級研究員兼研究高級副總裁杰夫·迪恩(Jeff Dean)表示,隨著時間的推移,這種培訓在讓NLP模型“理解”上下文方面變得非常有效。
谷歌表示,它在過去幾天始終在推動算法改進,這應該會影響到美國約10%的英語搜索查詢結果,其他語種的改進將在稍后討論。
對搜索的所有改進都會經過一系列測試,以確保它們確實改善了查詢結果。其中一項測試涉及使用谷歌的核心人類評審員,他們通過對搜索結果的質量進行評級來培訓公司的算法。此外,谷歌還會進行實時A/B測試。
當然,并不是每個查詢都會受到BERT的影響,這只是谷歌用來對搜索結果進行排名的諸多不同工具中最新的一個。這些工具到底是如何兼容工作的,這仍然是個謎。谷歌有意將其中某些過程保秘,以防止垃圾郵件發(fā)送者對其系統(tǒng)進行欺騙。
除此之外,保密的另一個重要原因是:當計算機使用機器學習技術做出決定時,很難知道它做出這些選擇的原因。機器學習的所謂“黑匣子”是個棘手問題,因為如果結果在某種程度上是錯誤的,那么很難診斷原因。
谷歌表示,該公司已經努力確保在搜索算法中加入BERT后不會增加偏差,這是機器學習中的一個常見問題,機器學習的訓練模型本身也是存在偏差的。由于BERT是在巨大英語句子語料庫上訓練的,這些句子本身也是有偏見的,所以這是個需要密切關注的問題。
該公司還表示,預計其新算法在引導流量方面不會出現(xiàn)重大變化,至少對于大型出版商而言是這樣。每當谷歌發(fā)出改變其搜索算法的信號時,整個網絡都會加以密切關注,畢竟谷歌搜索排名的變化有時候決定了公司的生死存亡。
每個依靠網絡流量賺錢的人絕對應該注意到這一點。當談到其搜索結果的質量時,納亞克說:“這是我們在過去五年中經歷的最積極的變化,也可能是公司成立以來最大的變化之一。”
[責任編輯:linlin]
宿州市埇橋區(qū)面對面幫助企業(yè)解決實際困難 增強企業(yè)發(fā)展信心
安徽合肥電網最大負荷達864.1萬千瓦打破紀錄 全力確保整體電網
安徽宣城努力打造安徽美食文化特色“名片” 開展校企合作培養(yǎng)人
安徽蕭縣多舉措落實放心家政暖民心行動 推動目標任務落地落實
安徽全面完成今年全省夏種糧食播種 重點作物全面落實
安徽出臺9條措施大力支持高校畢業(yè)生筑夢江淮 引導加大人才招聘
前5個月安徽新材料產業(yè)規(guī)上產值同比增長14.1% 雙招雙引成果豐碩
5月份安徽新增人民幣各項貸款708.66億 信貸結構不斷優(yōu)化
黑龍江出臺一系列助企紓困政策 加大承保折扣力度
黑龍江哈爾濱出臺多項政策“促進四大經濟發(fā)展” 強化核心共性技
安徽六安今年繼續(xù)加大農村公路建設力度 推行鄉(xiāng)村道路專管員制度
安徽銅陵設置共計103個社區(qū)臨時蔬菜供應點 方便群眾就近買菜