全網(wǎng)最全!GPT-4和ChatGPT相關(guān)應用梳理
原創(chuàng) | 文BFT機器人

01
核心觀點
3月15日 OpenAI發(fā)布多模態(tài)大模型GPT-4,其不僅在語言處理能力上提高,還具備對圖像的理解和分析能力。GPT-4商業(yè)化進程加快,開放API的同時還發(fā)布了在6個不同商業(yè)場景的應用落地。隨后微軟發(fā)布了震撼的微軟365 Copilot,極大提升office的生產(chǎn)力和交互方式。此前,ChatGPT就已經(jīng)展示了強大的能力,在文字創(chuàng)造、人機交互、教育、影音、零售等多場景落地應用。
我們認為,多模態(tài)大模型已在多領(lǐng)域具有專家能力,未來將深度賦能千行百業(yè),改變生產(chǎn)生活方式。
2023 年3 月15 日,OpenAI 目前最強大的多模態(tài)預訓練大模型GPT-4 正式發(fā)布。
其能夠處理文本、圖像兩種模態(tài)的輸入信息,單次處理文本量是ChatGPT的8倍,GPT-4的表現(xiàn)大大優(yōu)于目前最好的語言模型,同時在學術(shù)考試中的水平遠超GPT3.5。這意味著GPT-4不僅在學術(shù)層面上實現(xiàn)了模型優(yōu)化與突破,同時也展現(xiàn)出了成為部分領(lǐng)域?qū)<业哪芰Α?/p>
GPT-4 商業(yè)化進程加快。GPT-4在發(fā)布時便開放了其純文本輸入的API,這與GPT-3和GPT-3.5的滯后開放不同。同時,GPT-4這次一起推出了6個商業(yè)場景的具體應用落地,在優(yōu)化人機交互體驗、提供專業(yè)服務、提升組織效能、文化傳承與保護等方面都展現(xiàn)了巨大的潛能,未來有望看到更多場景中的商業(yè)化拓展與落地。
ChatGPT 已經(jīng)刮起GPT 生態(tài)狂潮。2023年3月1號,OpenAI基于GPT 3.5 Turbo模型開放了ChatGPTAPI。API收費模式為0.002美元/1000tokens。相較于前一代開放接口GPT 3.5,性能更強的同時,價格下降90%,加速ChatGPT相關(guān)應用生態(tài)的發(fā)展。
應用百花齊放,創(chuàng)造新的生產(chǎn)方式。微軟先后在搜索引擎Bing、企業(yè)服務平臺Dynamic 365及開發(fā)者工具平臺PowerPlatform等接入 ChatGPT/GPT-4能力。微軟還發(fā)布了震撼的Microsoft 365 Copilot,極大提升office的生產(chǎn)力和交互方式。與此同時,在越來越多的企業(yè)宣布接入ChatGPT的能力,其中不乏一些已經(jīng)取得優(yōu)秀商業(yè)化的應用。如Jasper、Quizlet、Shop等,在語言文字創(chuàng)造、人機交互、教育、繪畫、影音、零售等多場景落地應用。
我們認為以GPT4/ChatGPT為代表的預訓練大模型是這一輪AI浪潮的重要革新,重點推薦關(guān)注海內(nèi)外優(yōu)秀應用落地情況,AI芯片產(chǎn)業(yè)鏈等投資機遇。
02
ChatGPT:從全民關(guān)注的爆款應用走向
商業(yè)化開放,在多個場景中展現(xiàn)價值
2.1 AIGC商業(yè)化演進:重點產(chǎn)品時間線
隨著技術(shù)的快速進步,AI生成內(nèi)容(AIGC)極大地解放了生產(chǎn)力,其廣闊的應用場景及市場價值推動著其商業(yè)化的快速發(fā)展。
垂直領(lǐng)域快速落地,爆款產(chǎn)品不斷推出。隨著技術(shù)不斷演進,尤其是Diffusion、Transformer和Clip等模型的提出,AIGC的商業(yè)化在多個領(lǐng)域開始落地。其中代碼生成、文本生成、圖像生成、音視頻/游戲等領(lǐng)域已有不少爆款級產(chǎn)品。
? 代碼領(lǐng)域:基于OpenAI的Codex模型,Github推出的Copilot具備代碼的生成、補全、建議等功能,用戶量突破百萬級別。
? 文本領(lǐng)域:ChatGPT目前已開放API接口,微軟已經(jīng)在Bing和Dynamic365等應用接入。3月份發(fā)布的多模態(tài)預訓練大模型GPT-4已開放純文本API,在圖片理解、推理和學術(shù)考試中展現(xiàn)了強大能力,未來將適用于更廣泛的應用場景。
? 圖像領(lǐng)域:Stable diffusion等文生圖應用已突破千萬級用戶量,目前是商業(yè)模式最成熟的領(lǐng)域,國內(nèi)也在積極布局。
? 音視頻/游戲領(lǐng)域:起步較晚,對模型復雜度和算力要求更高,百度的文心一言大模型已經(jīng)具備對視頻生成的能力。

2.2 ChatGPT開放接口, OpenAI商業(yè)化進一步推進
OpenAI 開放 ChatGPTAPI 和 WhisperAPI 應用程序接口,允許開發(fā)者將 ChatGPT 集成至他們的應用程序和服務中。
2023年3月1號,OpenAI宣布開放了ChatGPT API,其由自然語言大模型“GPT 3.5 Turbo” 支持,開放的API收費模式為0.002美元/1000tokens,較前一代價格下降90%。
OpenAI 根據(jù)API 調(diào)用的token (分詞)輸入和輸出總數(shù)計費。例如調(diào)用輸入10個token ,輸出20個token,則需要支付30個token的費用。同時token總數(shù)還需低于模型最大限制,GPT-3.5-turbo-0301版本的限制是4096個token。
除此之外,本次OpenAI 還開放了Whisper API。是一種語音轉(zhuǎn)換文字(speech to text)的模型,可以轉(zhuǎn)寫或翻譯語音,支持包括英語、中文、阿拉伯語、日語、德語、西班牙語等幾十種語言,使用Whisper API的費用為每分鐘0.006美元。
目前OpenAI 已經(jīng)開放了包括ChatGPTAPI 和WhisperAPI 在內(nèi)的多個API 接口,逐步推進商業(yè)化進程:OpenAI開放的語言類API包括用于對話的GPT-3.5-turbo(多段對話)、InstructGPT(一問一答),其中InstructGPT根據(jù)其性能可以分為Ada、Babbage、Curie、Davinci(由弱至強),這四個模型還提供針對具體場景的微調(diào)接口,其中的Ada還可以作為研究的基礎Embedding模型被調(diào)用。開放的多模態(tài)模型為Dall·E,根據(jù)處理圖像的像素不同進行收費。開放的音頻模型為Whisper。

2.3 微軟與OpenAI深度合作,依托前沿AI技術(shù)提升產(chǎn)品能力
微軟作為OpenAI 最為重要的合作伙伴和投資人,其旗下產(chǎn)品與OpenAI 的相關(guān)模型深度融合。
1.微軟旗下的搜索引擎結(jié)合了GPT4的技術(shù),將搜索、創(chuàng)造、聊天結(jié)為一體,多方位地滿足用戶個性化的需求;
2.微軟旗下的企業(yè)服務平臺Dynamic 365是融合CRM、ERP等功能的SaaS服務,其結(jié)合ChatGPT的技術(shù)推出Dynamics 365 Copilot,為銷售、服務、營銷到供應鏈等跨業(yè)務的人員提供幫助;
3.微軟旗下的開發(fā)者工具Power Platform,結(jié)合ChatGPT技術(shù)推出,Power Virtual Agents和AI Builder,分別提供構(gòu)建聊天機器人的低代碼方法和面向開發(fā)人員的生成AI功能。
微軟產(chǎn)品在融合了生成式AI 技術(shù)后展現(xiàn)出更強的產(chǎn)品能力和市場競爭力。
1. 以Dynamic 365 Copilot為例,在原先的工作場景中,營銷人員需要每天花費66%的時間進行郵件回復(根據(jù)Futurum研究),而Dynamics 365 Copilot的推出就有望大大減輕這方面的工作量。
2. 產(chǎn)品能力的提升也帶來了廣泛的市場關(guān)注度和認可度,以微軟Bing為例,Bing接入ChatGPT一個月后,微軟公布進展稱,經(jīng)過多年的穩(wěn)步發(fā)展,加上數(shù)百萬新Bing預覽用戶的推動,Bing每日活躍用戶已突破1億。在新Bing預覽版的數(shù)百萬活躍用戶中,大約三分之一是Bing的新用戶。

?

2.4.B端應用
Dynamic 365 & Power Platform
Dynamic365 是微軟推出的企業(yè)服務平臺,其中于2023年3月9日推出的的Dynamics 365 Copilot結(jié)合了ChatGPT相關(guān)的AI技術(shù),用于 CRM 和 ERP。
目前處于預覽階段,其可以為銷售、服務、營銷到供應鏈等跨業(yè)務的人員提供幫助,例如實現(xiàn)生成回復客戶信息的電子郵件,為團隊創(chuàng)建會議摘要,為營銷活動提供靈感等。

Power Platform 是微軟旗下的開發(fā)者工具,其中于2023年3月6日推出的Power Virtual Agents和AI Builder都已經(jīng)使用了OpenAI的GPT語言模型技術(shù)。
其中Power Virtual Agents通過聊天機器人的形式實現(xiàn)低代碼編程,比如將 AI 聊天機器人指向企業(yè)的特定資源,如網(wǎng)站或者知識庫,簡單配置便可使用,無須額外編寫代碼。而 AI Builder 結(jié)合了ChatGPTAPI(稱為Azure OpenAI 服務)的生成 AI 功能,允許開發(fā)人員使用 GPT 模型生成文本,包括匯總報告、生成內(nèi)容創(chuàng)意等等。

Jasper
Jasper 結(jié)合GPT-3,打造多款產(chǎn)品。截至2022年12月底,Jasper付費用戶達到7萬,2022年年收入7500萬美金,估值已達15億美金。旗下有多款產(chǎn)品接入GPT-3進行商業(yè)性文字創(chuàng)作:
Jasper Starter能夠利用預定義的模板完成摘要、產(chǎn)品描述、博客文章;
Boss Mode是一款寫作助手,能夠?qū)崿F(xiàn)靈活便捷的商業(yè)文案寫作。通過使用Boss Mode,用戶僅需要自己編輯20%的內(nèi)容,Jasper會完成80%的內(nèi)容;
Jasper for Business是專門為B端打造的服務,能夠定制化生成文案。用戶能夠創(chuàng)建新的自定義工作流程,開發(fā)專門滿足其需求的寫作助手;
Jasper Chat是一款起到激發(fā)想法和修改內(nèi)容功能的聊天機器人,而Jasper Art能夠為廣告、博客文章生成圖片。

Brex & Slack & ChatSpot.ai
Brex與OpenAi 合作,打造便捷化的金融信息平臺。Brex是一家美國的金融科技平臺。2023年3月7日,Brex宣布推出基于OpenAI技術(shù)的先進人工智能工具。通過Brex Empower平臺,客戶可以在聊天界面中,使用自然語言來描述要求,獲得相應的財務相關(guān)信息或是更為復雜的財務分析。

Slack基于ChatGPT 能力,助力日常辦公的效率提升。
Slack是Salesforce旗下的團隊協(xié)作工具,與Teams類似。2023年3月7日,Slack宣布引入OpenAI的ChatGPT,用戶可以在應用程序中直接對ChatGPT提問來獲得問題的答案。ChatGPT將協(xié)助用戶進行內(nèi)容理解、總結(jié)與歸納,進而實現(xiàn)工作效率的提高。
這一功能最初為OpenAI內(nèi)部團隊的協(xié)作工具,現(xiàn)在已經(jīng)向所有的Slack用戶開放。

ChatSpot.ai將ChatGPT 等AIGC 技術(shù)與CRM 結(jié)合,輔助實現(xiàn)多類任務。HubSpot是一個著名的營銷、銷售、服務平臺(CRM),其推出了一種新的生成AI工具ChatSpot,將HubSpot自己的CRM技術(shù)與OpenAI的ChatGPT、DALL-E 2和谷歌文檔應用程序結(jié)合,可以用自然語言完成多類任務,如調(diào)取數(shù)據(jù),生成報告等功能。
HireStack & Pencil
HireStack 結(jié)合GPT-3 提升面試效率。
HireStack是一家人力資源公司,它利用GPT-3生成面試問題以及對應的答案。參考AI給出的回答,HireStack能夠在面試時評估應聘者的專業(yè)能力以及與對應職位的匹配度,相比于傳統(tǒng)的人力資源公司,AI能夠極大提升HireStack工作效率。

Pencil 基于GPT-3 生成多樣化廣告。
Pencil可以生成效果良好、富有創(chuàng)意且符合品牌要求的廣告文案和視頻。GPT-3 使得 Pencil 不僅能夠一般性地描述產(chǎn)品,而是能夠圍繞產(chǎn)品進行創(chuàng)意營銷。例如,為打造一個手電筒廣告,Pencil在廣告中首先展現(xiàn)出在黑暗中工作是十分危險的,進而突出手電筒的重要性。更具創(chuàng)意的解決方案將使得Pencil的廣告對潛在客戶更具吸引力。

2.5 C端應用
Snapchat & Discord
Snapchat基于ChatGPTAPI 推出聊天機器人MyAI。Snapchat是一款由斯坦福大學學生開發(fā)的圖片分享軟件。2023年2月28日Snapchat宣布推出近日基于OpenAI的ChatGPTAPI的人工智能聊天機器人“MyAI”。目前,這一功能僅對訂閱了Snapchat+的高級用戶開放,訂閱費用為每月3.99美元。

目前,付費用戶數(shù)量為兩百萬,只占公司用戶總數(shù)的一小部分。公司表示,在不久的將來,平臺的所有客戶都可以免費或付費使用MyAI。
Discord 基于ChatGPTAPI 推出聊天機器人Clyde。
Discord是一個游戲聊天應用與社區(qū),每月有3000萬用戶在社區(qū)中體驗AI相關(guān)的應用。2023年3月10日,Discord宣布引入OpenAIAPI推出了聊天機器人Clyde,其可以加入到Discord的不同頻道中(通過輸入“@Clyde”就可以在任意頻道中與Clyde進行對話),實現(xiàn)對話總結(jié)、基于對話中的問題作答、歌單推薦、與用戶進行互動游戲等方面的功能。

Bing
Bing整合Open AI 新一代技術(shù),帶來搜索引擎范式轉(zhuǎn)移。
2月8日,由ChatGPT和GPT-3.5提供支持的全新搜索引擎Bing正式亮相。新版Bing在傳統(tǒng)的搜索外還有對話窗口,可向它提問或是征求它的意見。例如用戶可以向其詢問參加音樂節(jié)的建議。

除此之外 ,新版 Bing 還可以進行創(chuàng)作,例如根據(jù)提示幫助用戶用戶生成從電子郵件到社交媒體的文本,或是表格化的輸出幫助用戶更好對比產(chǎn)品的差異。

此外, Bing 在不斷迭代,3月7日,Bing發(fā)布了具有三個風格的新版產(chǎn)品以更好滿足用戶個性化的需求。此外,移動版的Bing也在11日發(fā)布,用戶在手機上即可使用最新版本的Bing。我們認為,新 Bing 不同于傳統(tǒng)的搜索引擎,將“搜索+ + 創(chuàng)造+ + 聊天”融為一體,能夠更加靈活地滿足用戶多樣化需求,或?qū)硭阉饕娴姆妒睫D(zhuǎn)移。
新 Bing 下載量激增,日活已突破1億。
Bing接入ChatGPT一個月后,微軟公布其進展稱,經(jīng)過多年的穩(wěn)步發(fā)展,加上數(shù)百萬新 Bing 預覽用戶的推動, Bing每日活躍用戶已突破1億。在新 Bing 預覽版的數(shù)百萬活躍用戶中,大約三分之一是 Bing 的新用戶。

DuckDuckGo 與OpenAI 合作,推出DuckAssist。
DuckDuckGo是一個主打隱私保護的互聯(lián)網(wǎng)搜索引擎,于2023年3月9日推出了測試版 DuckAssist,通過 AI 工具來幫助用戶快速找到答案。DuckAssist 的設計目標是從維基百科等類似來源中,總結(jié)出用戶所需要的答案,并以自然語言的方式傳達給用戶。
DuckDuckGo邀請所有用戶對DuckAssist的功能進行測試,且不需要注冊用戶即可直接使用相關(guān)功能,如果測試進展順利,它將在“未來幾周內(nèi)”正式添加到瀏覽器中。

Quora 基于不同的語言模型,推出了聊天機器人Poe。
Quora是一個專業(yè)問答平臺/知識問答社區(qū),類似于美國版的知乎。Quora推出了新的AI聊天機器人應用Poe,最早在2022年12月亮相,但在2023年2月全面發(fā)布。所有iOS用戶都可以通過電話號碼和電子郵件注冊賬戶,然后就能在三種不同的AI聊天機器人中切換,獲得相應的聊天結(jié)果。
具體的聊天機器人包括Sage、Dragonfle(均由OpenAI支持)、 Claude (由支持Anthropic )。目前Poe作為獨立產(chǎn)品推出,但若Poe上的相關(guān)內(nèi)容達到一定的質(zhì)量標準,就會被發(fā)布至Quora網(wǎng)站上,供每月4億訪問者快速查詢。

Quizlet & Instacart & Shop
Quizlet 結(jié)合ChatGPT API,推出AI 導師Q-Chat。
Quizlet是一個全球性的學習平臺,有超過6000萬的用戶。結(jié)合ChatGPT API,Quizlet于2023年2月28日推出了AI導師Q-Chat,其可以基于相關(guān)學習材料提出自適應問題,生成有趣的聊天內(nèi)容來與學生進行互動。

Instacart 基于ChatGPT 和相關(guān)AI 技術(shù),推出Ask Instacart 功能。
Instacart是一家美國的生鮮雜貨電商平臺。Instacart利用ChatGPT和自研的AI技術(shù),結(jié)合平臺上超過75000個零售合作伙伴店鋪的產(chǎn)品信息,幫助客戶實現(xiàn)他們的開放式購物目標,例如可以回答客戶的“我的孩子們午餐吃什么健康的食物?”一類的開放性問題,這一功能名為Ask Instacart,將在今年晚些時候推出。

Shopify 結(jié)合ChatGPT,提供消費個性化推薦服務。
Shop是Shopify的消費者應用程序,有上億消費者在程序上尋找品牌和產(chǎn)品信息。通過與ChatGPT的結(jié)合,Shpo購物助手會根據(jù)用戶文字描述的需求,掃描數(shù)百萬商品快速找到買家所需,提供個性化推薦,實現(xiàn)物流程的簡便化、高效化。

Anania & Tabnine
Anania結(jié)合多種語言模型進行數(shù)據(jù)分析。
Anania 是一款數(shù)據(jù)分析軟件,GPT3是Anania使用的AI模型之一。其可以通過簡單、自然的英語對話來分析用戶的數(shù)據(jù)。用戶可以通過它對數(shù)據(jù)進行搜集、分析、可視化和導出。例如用戶輸入“向我展示出周內(nèi)和周末用手機進行對話的用戶比例的差異”,Anania即可快速生成對比圖表。

Tabnine 結(jié)合GPT-2 生成代碼。
Tabnine使用生成AI技術(shù)來預測并根據(jù)上下文和語法來推測用戶的下一行代碼。在編寫代碼時,Tabnine可以為用戶推薦其預測的整行代碼?;蛴脩糨斎胱⑨專琓abnine 則會為其推薦正確的代碼。

Jarvis Lyrics & Rationale
Jarvis Lyrics基于GPT3 的歌詞生成工具。Jarvis是歌曲創(chuàng)作的伴侶。它能夠根據(jù)任何藝術(shù)家、流派、標題和歌詞的提示生成歌詞建議。然后,用戶可以根據(jù)建議創(chuàng)作自己的歌詞。該工具利用隨機輸入的語句或創(chuàng)意故事生成的歌詞使得藝術(shù)家獲得更多靈感。

Rationale基于GPT3 的決策助手。
用戶只需輸入無法決定的選項,Rationale就會根據(jù) GPT 和上下文學習算法列出該決定的優(yōu)缺點、生成 SWOT 分析或進行多標準分析以幫助用戶權(quán)衡選擇。通過考慮所有相關(guān)因素和用戶的背景,Rationale可以幫助用戶做出理性的決定。

03
GPT4:更強大的多模態(tài)大模型,
帶來更廣泛的商業(yè)應用可能
1.1.1 GPT-4: OpenAI最強大的多模態(tài)大模型
2023 年3 月15 日, OpenAI 發(fā)布多模態(tài)預訓練大模型GPT-4 ,并稱其是目前最強大的多模態(tài)大模型。其主要特點如下:
GPT-4 具備從圖像中獲取和分析信息的能力:GPT-4不僅擁有圖像閱讀能力,還可以從圖像中提取邏輯,進行分析思考。以左圖為例:問:如果把圖中的繩子剪掉會怎么辦?GPT-4: 氣球會飛走。
GPT-4對圖片的理解能力、分析邏輯能力、物理等學科的知識儲備都賦予了這個模型強大的智能。

GPT-4 能夠處理更長的文本輸入:在ChatGPT模型中,單次輸入的文本量為3000個單詞左右,而GPT-4模型單次能夠處理超過25000個單詞,是上一代ChatGPT模型的近8倍,代表著對長文章的閱讀、分析、生成能力大幅提高。

3.1.2 GPT-4: 能力更為強大而全面的多模態(tài)預訓練大模型
GPT-4 更具備創(chuàng)造力和協(xié)作能力:它可以與用戶一起生成、編輯和迭代創(chuàng)意和技術(shù)寫作任務,例如創(chuàng)作歌曲、編寫劇本或?qū)W習用戶的寫作風格。如下左圖所示,GPT-4根據(jù)用戶要求生成了一個解釋灰姑娘故事情節(jié)的句子,并且每個單詞首字母需滿足字母表A-Z的排序。
GPT-4 相較于ChatGPT 有更強的高級推理能力:GPT-4能夠回答出ChatGPT所不能回答的更為復雜的邏輯問題。如下右圖所示,給定三個人物不同的空閑時間,要求模型安排出合適的會議時間,ChatGPT無法在此問題上給出正確答案(右圖灰白色文字),而GPT-4能夠合理的完成這一要求(右圖綠色文字)。而在GPT-3.5難以處理的如AP Calculus BC(AP微積分)考試中,GPT-4的水平超過40%的應試者。

3.2.1 GPT-4: 從語言模型走向多模態(tài)模型,帶來更為豐富的應用場景
GPT-4 是大型多模態(tài)模型,能夠接受圖像和文本兩種模態(tài)的輸入,再通過文字給出正確的文本答復,在多個不同的應用場景中展現(xiàn)出強大的能力。
給出一道物理題和相應的示意圖,GPT-4可以給出具體的解題步驟和相應的答案。給出論文的截圖,GPT-4可以總結(jié)出論文的主要內(nèi)容,并根據(jù)用戶進一步的提問補充其中的細節(jié),在用戶的指令下,GPT-4進一步解釋了論文中的第二個圖像涉及的具體步驟。

3.2.2 GPT-4: 從語言模型走向多模態(tài)模型,帶來更為豐富的應用場景
用戶給出一張具有相關(guān)數(shù)據(jù)信息的圖表并提出了一個和圖表數(shù)據(jù)相關(guān)的問題,GPT-4可以識別出圖表中對應的數(shù)據(jù),給出問題的處理步驟和處理結(jié)果。給定一張含有芬蘭、格魯吉亞、西亞每日人均肉類消費的圖表,GPT4按照要求計算出了格魯吉亞和西亞每日人均肉類消費的和并給出了對應步驟。
輸入一張圖片并提出和圖片相關(guān)的問題,GPT-4可以基于圖片給出準確的回答。
輸入一張“VGA線充手機”的圖片并要求GPT-4解釋圖片幽默的原因,GPT-4成功按照用戶的要求給出了圖片的三個部分的具體含義并正確給出了圖片之所以看上去滑稽是因為“將較大的VGA數(shù)據(jù)線接到了相對迷你的現(xiàn)代手機上”。

3.3 GPT-4: 從“百科全書”逐步成為文理通吃的“專家”
相較于過去的GPT 系列模型,GPT-4 在更多應用領(lǐng)域成為專家,包括為機器學習模型評判標準和為人類設計的專業(yè)測試。
在為機器學習模型設計的傳統(tǒng)基準上,GPT-4 的表現(xiàn)大大優(yōu)于了目前的最好的語言模型,以及大多數(shù)SOTA 模型相較于GPT-3.5以及當前最好的語言模型,GPT-4在機器學習模型學術(shù)基準數(shù)據(jù)集上的表現(xiàn)實現(xiàn)了全面突破,在7項數(shù)據(jù)集中的測試均優(yōu)于當前最優(yōu)的語言模型。
除了在Drop基準數(shù)據(jù)集上與QDGAT模型有一定差距,GPT-4在其余6項基準數(shù)據(jù)集的測試都實現(xiàn)了當前世界最優(yōu)秀的性能。在MMLU數(shù)據(jù)集中,GPT-4不僅在英語語言上的性能實現(xiàn)了突破,在其他語言方面的表現(xiàn)也優(yōu)于現(xiàn)在的語言模型。
在為人類設計的各種專業(yè)測試和學術(shù)基準數(shù)據(jù)集中,GPT-4 展現(xiàn)出媲美甚至優(yōu)于人類的水平。

GPT-3.5模型在一些相對簡單的人類專業(yè)測試中已經(jīng)展現(xiàn)出不錯的性能,但當任務的復雜度上升后,其便難以處理,而GPT-4模型在一些相對困難的任務中也已經(jīng)取得相當優(yōu)異的性能。
例如其在模擬律師考試中取得了應試者中前10%的成績,而GPT-3.5模型只有倒數(shù)10%的成績,甚至在GPT-3.5難以處理的如AP Calculus BC(AP微積分)考試中,GPT-4的水平也已經(jīng)超過40%的應試者。

3.4 GPT-4:在可控性和真實性方面比ChatGPT有大幅提升
GPT-4 更加可控,回答更加符合事實:Open AI 花費了 6 個月時間使用對抗性測試程序和ChatGPT的經(jīng)驗教訓對GPT-4進行迭代調(diào)整,從而在可控性和真實性上取得了很好的結(jié)果。在內(nèi)部評估中,GPT-4 回答可能生成有害內(nèi)容的輸入的可能性降低了 82%,產(chǎn)生符合事實回復的可能性高出 40%。
引入人類反饋進行訓練。Open AI引入了ChatGPT用戶以及50名來自人工智能、網(wǎng)絡安全、生物安全和國際安全等領(lǐng)域的專家提交的反饋來訓練模型,以使模型的回答避免含有某些不恰當?shù)难哉摗?/p>

從實際使用中不斷提升。Open AI將以前模型的使用經(jīng)驗應用到 GPT-4 的安全研究和監(jiān)控系統(tǒng)中。例如Open AI會自動檢測用戶的行為是否違背安全性原則。若違反,系統(tǒng)會臨時發(fā)布警告暫?;蚪褂脩舻男袨?。與 ChatGPT 一樣,隨著越來越多的人使用它,Open AI將定期更新和改進 GPT-4。
GPT-4 協(xié)助進行安全方面的研究。GPT-4 的高級推理和指令遵循功能加快了安全研究工作。Open AI使用 GPT-4 來幫助創(chuàng)建訓練數(shù)據(jù),以便在訓練、評估和監(jiān)控中對分類器進行微調(diào)和迭代。

3.5 ChatGPT升級GPT-4版本,GPT-4開放相應API加速商業(yè)化
ChatGPT 升級了對應的GPT-4 版本:在GPT-4發(fā)布后,OpenAI直接將GPT-4接入了ChatGPT。訂閱了ChatGPT Plus的用戶可以有使用上限的GPT-4訪問權(quán)限。
GPT-4 開放了相應的API :GPT-4純文本API可以通過注冊申請的方式獲取,但目前圖像輸入仍處于Alpha測試階段,尚未開放給用戶。價格方面,輸入長度為8K的版本輸入和回復的價格分別為每1000個token 0.03美金和0.06美金,輸入長度為32K的版本輸入和回復的價格分別為每1000個token 0.06美金和0.12美金。

GPT-4 商業(yè)化落地加速:GPT-4強大的性能和解決豐富場景下具體問題的能力讓其在優(yōu)化人機交互體驗、提供專業(yè)服務、提升組織效能、文化傳承與保護等方面都展現(xiàn)了巨大的潛能。

3.5.1 GPT-4商業(yè)應用:工作方式的革新
Microsoft 365 Copilot結(jié)合GPT-4 連通多種應用。Microsoft 365 Copilot將GPT-4 的強大功能與 Microsoft Graph 和 Microsoft 365 應用中的數(shù)據(jù)相結(jié)合,通過自然語言輸入即可產(chǎn)生強大生產(chǎn)力,極大提升了工作效率。

個人辦公:Copilot 被整合進所有的Microsoft 365 應用。在Word中,用戶簡單描述即可讓其生成初稿,也可輸入其它文件,指定內(nèi)容進行創(chuàng)作。在Excel中,它可以分析趨勢并進行數(shù)據(jù)可視化,用戶不再需要使用復雜的公式;在PPT中,它可以根據(jù)用戶的要求生成演示文稿,也可將其它文件轉(zhuǎn)為精美PPT;在Outlook中,它可以挑選出有價值的郵件并總結(jié)對應要點,還可以提供回復建議。

團隊協(xié)作:Copilot 不僅局限于Office 的幾個軟件,還將整個辦公生態(tài)全部打通。郵件、聯(lián)系人、在線會議等等軟件的數(shù)據(jù)都被接入大語言模型,構(gòu)成新的Copilot系統(tǒng)。Copilot會將錯過的會議消息匯總成報告。在會議中它能夠?qū)崟r做出總結(jié)。會議結(jié)束,Copilot還可根據(jù)內(nèi)容自動生成跟進郵件。此外,它還可以將重復的工作流程自動化,為公司做SWOT分析,實時協(xié)同工作等。

我們認為,結(jié)合了GPT-4 強大AI 能力的Microsoft 365 Copilot ,將帶來工作效率的大幅提升和工作方式的革新。
這一強大增值服務的落地將帶動Office ARPU 值(每個用戶貢獻收入平均值)的提升,并推動Office 軟件整體滲透率的提升,具有廣闊的市場前景。若按Microsoft 365 Office2022 年用戶數(shù)3.45 億人,保守參考GitHub Copilot 10 美金/ 月的訂閱費,假設其中20% 的用戶升級相關(guān)服務來計算,每年大約將帶來超80億美元的收入。
3.5.2 GPT-4商業(yè)應用:人機交互體驗優(yōu)化
Duolinguo使用GPT-4 改進對話功能。
Duolinguo是一個語言學習平臺,每月有超過50萬用戶使用其進行外語學習,提供40多種語言課程,支持 100 多種語言。與GPT-4合作的產(chǎn)品Duolinguo Max產(chǎn)品目前有兩項功能:
一是Roleplay,即角色扮演,用戶可以在眾多的場景中和AI伙伴進行對話練習,如下左圖便是一個模擬用法語在咖啡廳場景中點單的例子;二是 Explan My Answer,即答案解釋,會針對用戶的回答對上下文的錯誤進行反饋,若用戶對解釋尚不滿意,可以要求獲得進一步的解釋。目前Duolinguo Max應用于西班牙語和法語,未來將應用于更多語言,并開發(fā)更多功能。


Be My Eyes使用GPT-4 優(yōu)化視覺輔助功能。
Be My Eyes是一家創(chuàng)立于2012年的丹麥公司,持續(xù)為超過2.5億視力障礙或弱視人群提供輔助技術(shù)。借助GPT-4的多模態(tài)技術(shù),Be My?Eyes在其應用程序中正在開發(fā)Virtual Volunteer功能, 其可以產(chǎn)生與人類志愿者相同水平的分析、理解和反饋能力。
例如下圖所示,對于兩件條紋襯衫進行拍照,便可以回復與圖片相關(guān)的問題,如“哪一件是紅色條紋襯衫”、“紅色條紋襯衫之外的另外一件是什么樣的”。Be My eyes的首席執(zhí)行官表示,這項技術(shù)將滿足視力障礙或弱視人群大量的視覺解釋需求,使他們在生活中擁有更大的獨立性。

3.5.3 GPT-4商業(yè)應用:提供專業(yè)且個性化的服務
Khan Academy 結(jié)合GPT-4 的教育平臺。
Khan Academy是一個非盈利的教育平臺。其2022 年開始測試最新版本的 Open AI 語言模型,將向部分參與者提供 Khanmigo 試點計劃。結(jié)合GPT-4打造的 Khanmigo AI助手可以為學習者提供定制化的教育以及為教師提升工作效率。
為學習者提供定制化教育:GPT-4像人類一樣多輪對話的能力使得 Khan Academy 能夠向每個學生提出個性化的問題,以促使其更深入地學習。如下左圖所示,學習者向 Khanmigo 詢問數(shù)學題時,Khanmigo沒有直接給出答案,而是通過問題的形式一步步引導學習者回憶學過的知識,并提供解決問題的思路。這樣能夠使學習者更加深入地思考,達到更好學習效果。
為教師提高工作效率:教師可以利用Khanmigo編寫課堂提示或為課程創(chuàng)建教學材料。如下右圖所示,Khanmigo通過問答逐步了解教師想法和課程進度,而后為教師提供教學設計的方案。

3.5.4 GPT-4商業(yè)應用:提升組織運行效能
Stripe結(jié)合GPT-4 的支付平臺。
Stripe是一個支付平臺,借助GPT4的能力進行更好地服務客戶、回答技術(shù)問題以及識別虛假信息。
在客戶服務方面,Stripe發(fā)現(xiàn)部分客戶會隱藏它們的網(wǎng)站,因此在跟進服務時搜索它們需要花費很多時間精力。借助GPT-4,Stripe能夠掃描這些這些網(wǎng)站并且做出匯總,相比于人工節(jié)省了很多精力。
在回答技術(shù)問題方面,借助GPT-4,Stripe能夠快速理解用戶的問題,代替他們閱讀詳細的文檔,梳理想關(guān)信息分并總結(jié)出一個解決方案,這將極大地提升工作效率。
在識別虛假信息方面,在Stripe支持的社區(qū)Discord中有很多不懷好意的使用者是為了獲取用戶信息或者散步虛假信息才加入其中。GPT-4 通過分析 Discord 中帖子的語法,就會發(fā)現(xiàn)欺詐團隊,以方便相關(guān)工作人員將他們清除出去。

此前,Stripe也曾整合了GPT-3以更好服務客戶,包括總結(jié)客戶問題的功能。
3.5.5 GPT-4商業(yè)應用:提升組織運行效能
Morgan Stanley 利用GPT-4 來實現(xiàn)企業(yè)運作中多維度的提升。
與其他公司使用GPT系列模型來提升工作效率相似, GPT-4模型從海量的預訓練數(shù)據(jù)集中學到的海量知識以及高效的處理文本間信息的能力,也被Morgan Stanley用于協(xié)助員工實現(xiàn)工作效率的提升。如下圖便是通過咨詢系統(tǒng)幫助解答客戶如何開通線上賬戶的問題。目前每天有超過200名員工在系統(tǒng)上進行相關(guān)問題的咨詢并得到他們需要的反饋。
Morgan Stanley作為成立時間近百年的全球財富管理領(lǐng)導者,其內(nèi)部數(shù)據(jù)庫中包含了大量高質(zhì)量的涵蓋全球資本市場、資產(chǎn)類別、行業(yè)分析和經(jīng)濟區(qū)域等方面的見解。
這些知識以PDF形式存儲在多個內(nèi)部網(wǎng)站中,搜索和掃描以找到特定問題的答案是一個相當繁瑣的過程,而GPT-4的應用讓這些豐富而深刻的知識以一種更可用和可操作的格式出現(xiàn),助力公司內(nèi)部數(shù)據(jù)與知識應用高效化。

3.5.6 GPT-4商業(yè)應用:文化保護與傳承
冰島政府利用GPT4 來實現(xiàn)對于語言的保護。
在英語逐漸成為主流的工作語言的當下,使用人口僅三十余萬的冰島語面臨著語言和文化層面的巨大沖擊。在過去,由于大規(guī)模語言模型的訓練數(shù)據(jù)往往來自互聯(lián)網(wǎng)上的廣泛語料,而這些語料大都是英語或其他使用人口更為廣泛的語言,因此對于像冰島語一樣的小眾語種效果較差。
GPT-4的出現(xiàn)改變了這一情況,一方面,其實現(xiàn)了相較于GPT-3.5而言更為優(yōu)秀的對于冰島語的理解和生成能力,另一方面,對于GPT-4的冰島語能力的“培訓”(實質(zhì)是微調(diào))也變得更為容易。因而目前GPT-4不但可以實現(xiàn)較為準確的冰島語翻譯(之前GPT-3和ChatGPT都還無法完成)還可以創(chuàng)造一首來自北歐神話的古代冰島詩,甚至是根據(jù)冰島當?shù)氐奈幕攸c進行相應問題的回答,如右圖所示,若提問者使用冰島語進行提問,GPT-4則會基于冰島的情況進行回答。在未來將有希望發(fā)展出基于冰島語乃至其他小眾語種專用的聊天機器人,這極大地推進了對冰島語這一類小眾語種的保護。


??
更多精彩內(nèi)容請關(guān)注公眾號:BFT機器人
本文為原創(chuàng)文章,版權(quán)歸BFT機器人所有,如需轉(zhuǎn)載請與我們聯(lián)系。若您對該文章內(nèi)容有任何疑問,請與我們聯(lián)系,將及時回應。