搜索煮譯∣生成式AI搜索給搜索引擎帶來哪些變化
本期內(nèi)容摘譯自Geekflare,文末附有英文版原文鏈接。
自移動設(shè)備推出AI個人助手Cortana、Siri等以來,AI已經(jīng)影響了我們的生活,通過在物聯(lián)網(wǎng)設(shè)備上使用AI,您可以控制家庭和工作場所的許多事情。接著,AI進(jìn)入了多媒體制作行業(yè),可以通過關(guān)鍵詞或指令生成圖像、視頻、音頻和文本等內(nèi)容。如今,先進(jìn)的AI可以將視頻和音頻等內(nèi)容編輯到完美狀態(tài)。簡言之,AI無處不在。隨著AI的不斷發(fā)展,搜索引擎也將受到越來越多的影響,這將導(dǎo)致全網(wǎng)的內(nèi)容搜索發(fā)生重大變革。
1.什么是生成AI搜索?想要理解生成式AI搜索的概念,首先須了解什么是生成式AI。這種AI可以從樣本內(nèi)容中生成文本、圖像、音頻、程序代碼等內(nèi)容。
開發(fā)人員使用機(jī)器學(xué)習(xí)(ML)模型訓(xùn)練生成式AI,使其理解機(jī)器語言中的自然內(nèi)容。
2.生成式AI模型
生成式AI使用各種機(jī)器學(xué)習(xí)(ML)模型來訓(xùn)練AI程序、聊天機(jī)器人或虛擬助手。比如:
1)生成模型與判別模型
在AI訓(xùn)練中的判別模型中,一位人類監(jiān)督員會訓(xùn)練AI學(xué)習(xí)輸入樣本中兩個或多個對象之間的區(qū)別。例如,若向AI提供10張10種不同動物的圖片作為輸入,底層的判別模型將幫助其區(qū)分所有動物。
生成模型幫助AI在半監(jiān)督或無監(jiān)督的情況下,根據(jù)樣本數(shù)據(jù)創(chuàng)建對象、理解輸入數(shù)據(jù),并將該理解保留在其神經(jīng)網(wǎng)絡(luò)記憶中,以便在未來遇到類似的挑戰(zhàn)時調(diào)用。
2)生成對抗網(wǎng)絡(luò)(GANs)
該模型結(jié)合了生成和判別模型進(jìn)行AI訓(xùn)練。首先,生成模型輸入向量(如關(guān)鍵詞、問題等)創(chuàng)建樣本。然后,判別模型必須確定創(chuàng)建的樣本是假的還是原始輸入。若是假的,那么生成模型會重新創(chuàng)建樣本,直到創(chuàng)建出判別模型無法分辨的偽造品。
3)基于Transformer的模型
有許多基于Transformer的AI模型,如ChatGPT、LaMDA。
AI開發(fā)人員使用上述模型創(chuàng)建了許多功能性的生成式AI程序,可通過簡單的輸入(如圖片、文本、描述、音頻等)來執(zhí)行或生成以下操作:
引用網(wǎng)站、雜志、Google圖像搜索等的輸入,生成不存在的人類圖象
從草圖生成真實(shí)圖像
將一種藝術(shù)形式轉(zhuǎn)化為另一種
輸入MRI掃描,合成CT掃描
OpenAI的Dall-eAI僅憑文本可創(chuàng)建出色的圖像
DeepMind、AmazonPolly等AI可創(chuàng)建人類演講
AI音樂可將無版權(quán)的公共音樂轉(zhuǎn)化為配樂
一般來說,常規(guī)在線搜索引擎不會創(chuàng)建內(nèi)容,只是整合了其他網(wǎng)站的資源。當(dāng)您單擊搜索結(jié)果時,將直接轉(zhuǎn)到特定網(wǎng)站。而生成式AI搜索將分析所有搜索結(jié)果,生成定制內(nèi)容,并使用Web瀏覽器向您展示。若生成式AI搜索成為新常態(tài),以下差異或?qū)a(chǎn)生:
- 輸出內(nèi)容將很大程度上取決于創(chuàng)建生成式AI搜索模型公司的極端化。
- 有些思想學(xué)派會更喜歡XYZ生成式AI搜索工具而不是ABC工具。因此,基于在線搜索的工作會出現(xiàn)越來越多的異常情況。
- 這些搜索工具有時會呈現(xiàn)類似的內(nèi)容
- 搜索結(jié)果直觀,并以文本、圖像、視頻、音頻等形式豐富相關(guān)內(nèi)容。
- 在線研究工作量將大大減少,無需閱讀多個網(wǎng)頁撰寫內(nèi)容。
- AI開發(fā)人員將提出新的基于AI的在線廣告和其他收入模型,以增加他們的營業(yè)利潤。
- 網(wǎng)絡(luò)搜索中的分散程度將降低,搜索質(zhì)量可能會大大降低。
- 在用于商業(yè)前,您必須雇用才華橫溢的在線研究專業(yè)人員和數(shù)據(jù)分析師分析AI生成的內(nèi)容。
- 無明確的指導(dǎo)方針說明這種基于AI的網(wǎng)站搜索如何鏈接回源網(wǎng)站并給這些網(wǎng)站一些信用。因?yàn)檫@些AI不能在沒有參考內(nèi)容的情況下生成內(nèi)容。
- Google、Yahoo等的受歡迎程度將大幅下降。
- 來自搜索引擎的廣告收入也會大幅減少。
- 將出現(xiàn)一種新的收入流,即網(wǎng)站所有者將向生成式AI搜索提供商支付費(fèi)用,以展示他們網(wǎng)頁上的內(nèi)容。。
- 網(wǎng)站流量將大幅減少,因?yàn)橛脩魧⒃谄渌W(wǎng)頁上獲得所需內(nèi)容。
1)Bing
- 獲取各領(lǐng)域的建議。
- 利用像ChatGPT這樣的生成式AI生成創(chuàng)意內(nèi)容。
- 獲取直觀準(zhǔn)確的搜索結(jié)果,無彈窗干擾。
- 神經(jīng)匹配,可幫助搜索引擎找出查詢與頁面之間的關(guān)系。
- BERT,用于自然語言處理的預(yù)訓(xùn)練。
- GoogleLens,利用手機(jī)或平板電腦相機(jī)進(jìn)行物體搜索。
- 多任務(wù)統(tǒng)一模型或MUM,提供COVID-19疫苗信息的網(wǎng)頁搜索結(jié)果。
- SERP頂部顯示應(yīng)用程序、工具和結(jié)果的數(shù)量。
- 右側(cè)面板中彈出“PeopleAlsoAsk”結(jié)果。
- 獲得YouChat的建議。
- 顯示高權(quán)威社交媒體(如Reddit)的頂級討論卡片。
- 用戶還可向相同的搜索中添加更多查詢。
- YouChat
- YouCode
- YouWrite
特別說明:本文僅供學(xué)習(xí)交流,如有不妥歡迎后臺聯(lián)系小編。
- END -
翻譯技術(shù)教育與研究——搜索煮譯專題小組致力于普及搜商概念、推廣搜索資源、傳播搜索方法、讓搜索成為每一位譯者的習(xí)慣,從而提高譯者的工作效率。專題小組目前的主要方向是探索搜索資源、搜索內(nèi)容、搜索技巧、信息甄別、文本操控、碎片知識管理等相關(guān)知識。小組成員經(jīng)由老師指導(dǎo),通過定期會議及討論的形式確定選題,并以推文的形式分享探索結(jié)果。歡迎大家積極留言以及對搜索煮譯專題小組提供建設(shè)性意見!
原文作者:李倩楠
推文編輯:陳柯淼
指導(dǎo)老師:張成智
項目統(tǒng)籌:劉聰穎