【王詠剛,創(chuàng)新工場Al工程院執(zhí)行院長】確定性VS,非確定性:GPT時(shí)代的新編程范

后GPT時(shí)代,多模態(tài)是最大的機(jī)會(huì)
來源:公眾號(hào)(半輕人)
作者:王詠剛(SeedV實(shí)驗(yàn)室創(chuàng)始人/CEO,創(chuàng)新工場AI工程院執(zhí)行院長)
https://new.qq.com/rain/a/20230505A04I6900
我既是軟件工程師,也是投資人和創(chuàng)業(yè)者。我曾參與多個(gè)成功AI項(xiàng)目的創(chuàng)建、孵化或投資。今天,ChatGPT開啟了嶄新的AI 2.0時(shí)代,我個(gè)人也全力投入到一個(gè)3D+AI的全新創(chuàng)業(yè)歷程中。在我的創(chuàng)業(yè)團(tuán)隊(duì),大家最關(guān)心的AI核心技術(shù)是跨文本、圖像、視頻、3D、動(dòng)畫序列等信息的多模態(tài)AI。此前一段時(shí)間,我將我們團(tuán)隊(duì)在這個(gè)領(lǐng)域的思考整理成多份筆記。本文是這些筆記的匯總和歸納。童超、潘昊等SeedV實(shí)驗(yàn)室成員直接為本文貢獻(xiàn)了重要的技術(shù)實(shí)驗(yàn)、思考結(jié)論或參考信息,在此表示特別感謝。
核心觀點(diǎn)
一、未來的通用智能一定是多模態(tài)智能;
二、GPT-4代表的大語言模型具備某些多模態(tài)潛能;
三、多模態(tài)算法正處在“寒武紀(jì)大爆發(fā)”的早期;
四、多模態(tài)算法很可能再次收斂到某種“大力出奇跡”的超級(jí)大模型;
五、多模態(tài)是大模型科研與工程領(lǐng)域最好的彎道超車機(jī)會(huì);
六、GPT讓AI平民化,應(yīng)用開發(fā)者很難建立核心技術(shù)壁壘;
七、但在多模態(tài)領(lǐng)域,三至五年內(nèi)仍有修建“技術(shù)護(hù)城河”的大量機(jī)會(huì);