市值狂跌2300億后,扎克伯格把壓箱底的技術(shù)掏出來了
人工智能
轉(zhuǎn)自:智東西
市值一夜蒸發(fā)2300億美元后,扎克伯格開始拿出“AI黑科技”拯救自己的身價(jià)了!日前,扎克伯格特意舉辦了一場名為“元宇宙里的AI”的活動(dòng),專門宣布了Meta在AI領(lǐng)域的技術(shù)布局,這也是扎克伯格2022年首次談及Meta將在語音翻譯、AI創(chuàng)造以及語音助手等領(lǐng)域重點(diǎn)發(fā)力。
會(huì)上,Meta宣布研發(fā)一款為世界上每個(gè)人定制的翻譯軟件,研究人員通過構(gòu)建高級(jí)的AI模型和一款可適用所有語言的翻譯器,希望能在“元宇宙”中打造一個(gè)無障礙交流的空間。
Meta計(jì)劃研發(fā)一款新的AI系統(tǒng)BuilderBot,你在虛擬世界中說什么,AI就能給你展現(xiàn)對應(yīng)的畫面,看樣子AI也能成為“阿拉丁神燈”一樣的神器了。
不僅如此,Meta新推出了CAIRaoke項(xiàng)目,研發(fā)人員開發(fā)了一個(gè)端到端的神經(jīng)模型,它可以提供與人們進(jìn)行更多的交流,可以比以前簡單對話的層面更深一步,能夠理解人們說話的語境。
最新財(cái)報(bào)顯示,Meta旗下專攻“元宇宙”的Reality Labs部門2021年虧損102億美元。扎克伯格秘藏已久的AI大招,救得了聲勢漸垮的元宇宙嗎?
圖1:Meta 2021年股價(jià)變化圖
發(fā)力語音翻譯和語音助手
扎克伯格談道,現(xiàn)在多數(shù)AI研究的重點(diǎn)是如何讓AI更好地理解現(xiàn)實(shí)世界,但未來,AI需要幫助人們在現(xiàn)實(shí)世界和虛擬世界都能實(shí)現(xiàn)導(dǎo)航等功能。并且由于虛擬世界總是在發(fā)生變化,AI應(yīng)該像人類一樣擁有理解環(huán)境和學(xué)習(xí)的能力。“元宇宙世界中你將會(huì)與任何地方都能發(fā)生視覺交互,包括你在3D空間中的位置、面部、手勢等等肢體語言,這些都需要不同的輸入方式?!彼J(rèn)為AI是重要的數(shù)據(jù)入口之一。扎克伯格不但介紹了AI在語音翻譯、語音助手以及AI創(chuàng)造領(lǐng)域的應(yīng)用,還簡單談了Meta在推動(dòng)AI技術(shù)研究方面所作出的貢獻(xiàn)。
目前,Meta正在打造三個(gè)AI項(xiàng)目。第一個(gè)是被稱為BuilderBot的AI系統(tǒng),該系統(tǒng)可以讓人們通過描述虛擬世界的一部分來構(gòu)建它們。他們通過一段視頻展示BuilderBot未來的效果。比如說,當(dāng)人們身處虛擬世界時(shí),對這個(gè)系統(tǒng)說“我希望天上有片云”,AI將會(huì)自動(dòng)在島嶼上添加一片云。這么一想,如果該系統(tǒng)能夠研發(fā)成功的話,在虛擬世界里“衣來伸手,飯來張口”的日子也不遠(yuǎn)了。
圖2:BuilderBot的AI系統(tǒng)演示
第二個(gè)項(xiàng)目是Meta希望打造一款能夠像人類一樣思考的AI。Meta AI的首席AI科學(xué)家楊立昆(Yann LeCun)提出,是否能夠模仿世界的運(yùn)作方式,打造一款“世界模型”的能力可能是該項(xiàng)目的關(guān)鍵之處。“當(dāng)今AI最重要的挑戰(zhàn)之一是設(shè)計(jì)學(xué)習(xí)范式和架構(gòu),使機(jī)器能夠以自我監(jiān)督的方式學(xué)習(xí)世界模型,然后使用這些模型進(jìn)行預(yù)測、推理和計(jì)劃。”他說。
楊立昆嘗試運(yùn)用多種學(xué)科中的相關(guān)概念并將它們與機(jī)器學(xué)習(xí)中的新概念相結(jié)合,融入自我監(jiān)督學(xué)習(xí)(self-supervised learning)和聯(lián)合—嵌入式架構(gòu)(joint-embedding architectures)模型中。
第三個(gè)項(xiàng)目則和Meta的“元宇宙”布局相關(guān)。在去年十月的活動(dòng)中,Meta就曾展示過一個(gè)“萬能”的翻譯對話軟件,現(xiàn)在,這一場景背后的細(xì)節(jié)也逐漸浮出水面。
活動(dòng)上,Meta AI宣布將打造一款翻譯工具,該項(xiàng)目將分為兩個(gè)部分推進(jìn)。第一部分是覆蓋全語種,Meta正在構(gòu)建一個(gè)新的高級(jí)AI模型,該模型可以從需要訓(xùn)練的示例更少的語言中學(xué)習(xí),然后實(shí)現(xiàn)數(shù)百種語言的專家級(jí)翻譯。第二部分是打造通用語言翻譯器,研究人員正在設(shè)計(jì)一些新方法,希望能將一種語言的語音實(shí)時(shí)翻譯成另一種語言。
除此之外,扎克伯格也簡單介紹了一下Meta在隱私保護(hù)、數(shù)據(jù)開放等方面做出的貢獻(xiàn)。Meta與紐約大學(xué)朗格尼醫(yī)學(xué)中心合作開展了一個(gè)名為“快速M(fèi)RI”的項(xiàng)目,可以利用AI從較少的數(shù)據(jù)中創(chuàng)建磁共振成像,從而實(shí)現(xiàn)更快的磁共振掃描?!叭绻蛔屑?xì)考慮我們?nèi)绾我约昂螘r(shí)發(fā)布數(shù)據(jù),就無法真正推進(jìn)科學(xué)研究?!蓖瑫r(shí),扎克伯格也提到在發(fā)布數(shù)據(jù)集時(shí),他們會(huì)考慮以隱私和公平為指導(dǎo)原則。
打造AI模型和多款觸摸傳感器
Meta的AI研究人員多年來一直在討論如何建立一個(gè)豐富的、具有代表性的模型。并且這款新的模型不僅現(xiàn)在能夠?qū)崿F(xiàn)預(yù)測,還可以適用于未來。“我們希望模型可以進(jìn)行長期規(guī)劃和推理,以便未來在現(xiàn)實(shí)世界和虛擬世界中都能做好AI代理?!盕acebook AI Research的總經(jīng)理Joelle Pineau說。此外,她還向大家介紹幾個(gè)Meta正在重點(diǎn)研究的方向,其中有一款是“機(jī)器人”?!八梢酝黄茖?shí)驗(yàn)室或工廠等固定場景的限制。并且能夠在家中、在辦公室流暢地操作,自然地與人類交互?!盝oelle Pineau介紹道,“但我們同樣需要機(jī)器人自己可以觸摸等方式提高感知世界的能力?!?/p>
為此,Meta一直在研發(fā)新的觸摸傳感器。Meta正在與其他研究人員合作打造一款新的傳感器,目前該傳感器正處在原型階段。與其他傳感器不同的是,該觸摸傳感器的外層會(huì)有一層薄薄的膜,膜上嵌有磁性顆粒。當(dāng)觸摸傳感器變形時(shí),磁信號(hào)就會(huì)改變。通過這些變化,AI技術(shù)可以推斷接觸點(diǎn)施加力的大小,甚至能使用自我監(jiān)督學(xué)習(xí)模型來自動(dòng)校準(zhǔn)傳感器,使其更適用于各種場景。
圖3:觸摸傳感器
圖4:數(shù)字傳感器
打造“萬能”翻譯器
機(jī)器翻譯專家Angela Fan認(rèn)為,語言是我們用來理解與周圍世界互動(dòng)的主要途徑之一。她介紹自己在加拿大生活以及在巴黎工作時(shí),常常感受到語言障礙帶來的深遠(yuǎn)影響?;谶@些語音溝通壁壘,Meta希望每個(gè)人都能感受到最新的翻譯技術(shù),“我們希望所有未來的技術(shù)在默認(rèn)情況下都是具有包容性的?!?/p>
據(jù)預(yù)測,全球大約有20億人說的母語沒有任何可用的翻譯系統(tǒng)。并且,全球有數(shù)千種語言,但翻譯系統(tǒng)如今只支持大約100種語言。如何創(chuàng)建真正適合每個(gè)人的翻譯系統(tǒng)是Meta一直在思考的問題。
Angela Fan認(rèn)為,創(chuàng)建更具包容性的翻譯的第一步是開發(fā)能夠支持多種語言的系統(tǒng)。“我們要是想要實(shí)現(xiàn)多語種翻譯,我們就需要必須為每一個(gè)語言方向創(chuàng)建一個(gè)單獨(dú)的模型,這樣一來,我們就要?jiǎng)?chuàng)建數(shù)萬個(gè)模型,這是一件非常復(fù)雜的事情?!睘榱私鉀Q這一難題,Meta嘗試根據(jù)不同的語言體系來加強(qiáng)模型的訓(xùn)練能力。比如說,羅曼什語作為一個(gè)小眾語種,會(huì)與其他語言體系有共同點(diǎn),語種之間的聯(lián)系將會(huì)簡化語言模型的開發(fā)過程。
打造超級(jí)語音助手
Meta AI的高級(jí)研究經(jīng)理Alborz Geramifard談到語音交互助手可以分為三個(gè)類別。第一類是初級(jí)的語音助手。比如說我們想要查詢話費(fèi),打電話給客戶服務(wù),你會(huì)聽到請按1鍵獲得話費(fèi)信息,請按2鍵獲得訂閱服務(wù)等?!澳愠3?huì)發(fā)現(xiàn)你想要的服務(wù)不在選項(xiàng)列表中”。
第二類語音交互助手,但擁有可能有一些智能模型?!澳憧赡軙?huì)在家里和它們簡單的互動(dòng)。但它們不能理解語義背景,也不能進(jìn)行深度交流。”
第三類是Meta想要打造的超級(jí)語音助手。這類超級(jí)語音助手延續(xù)了深層次的語境,可以為用戶提供個(gè)性化體驗(yàn)。比如你想早晨放一首歌曲,同時(shí)窗外又在下雨,超級(jí)語音助手就會(huì)根據(jù)此刻的場景為你推薦一首歌曲播放。他還談到,能理解的AI和能交互的AI是兩種不同的概念。能理解的AI是一個(gè)單向的過程,從輸入到輸出,比如說轉(zhuǎn)錄音頻解析可以得到相應(yīng)的文本。
圖5:理解式AI和實(shí)時(shí)交互AI的區(qū)別
開放數(shù)據(jù)集力圖消除數(shù)據(jù)偏見
去年夏天,Meta就曾發(fā)布了文章概述了其AI原則的五大支柱,包括隱私和安全、公平和包容、穩(wěn)健性、安全性、透明度和可控性。
面對AI公平性,F(xiàn)acebook AI的項(xiàng)目經(jīng)理Jacqueline Pan談到AI團(tuán)隊(duì)與另一個(gè)內(nèi)部團(tuán)隊(duì)合作發(fā)布了一些對話數(shù)據(jù)集,這些數(shù)據(jù)集旨在幫助評(píng)估AI系統(tǒng)中可能存在的潛在算法。最新的數(shù)據(jù)集將包含超過45000個(gè)付費(fèi)參與者進(jìn)行非腳本對話的視頻,這些參與者透露了他們的年齡和性別,讓AI能夠相對公正地分析信息。此外,Meta還能夠提供膚色和聲音的標(biāo)簽,該數(shù)據(jù)集旨在幫助研究人員評(píng)估其計(jì)算機(jī)視覺和音頻模型在這些維度上的準(zhǔn)確性。
元宇宙這盤棋,扎克伯格用AI技術(shù)下
說起2022的開年,扎克伯格是真的慘。自從重壓元宇宙后,扎克伯格一邊成為行走的元宇宙代言,直接帶動(dòng)全球元宇宙熱度,另一邊Meta的股市表現(xiàn)卻愁云慘淡。這家曾躋身美股五巨頭的科技企業(yè),如今卻頹勢難挽,市值被昔日手下敗將特斯拉、英偉達(dá)、臺(tái)積電、騰訊壓了一頭。
今年2月3日,Meta公布其最新財(cái)報(bào),首次披露的元宇宙部門虧損從2019年45億美元顯著增加到2021年102億美元。當(dāng)天收盤其股價(jià)暴跌26%,創(chuàng)下美股市場歷史最大市值跌幅,市值跌超2370億美元。不僅股價(jià)暴跌、市值縮水,扎克伯格自己也掉出全球富豪榜前10,不可謂不狼狽。
顯然,人們對扎克伯格畫的元宇宙“大餅”還處于觀望狀態(tài)。而近日,扎克伯格完全從技術(shù)角度出發(fā),展示了一套依然緊密圍繞元宇宙藍(lán)圖的前沿AI技術(shù)套餐,以創(chuàng)造一個(gè)更有說服力的故事。但華爾街的投資者會(huì)為此買賬嗎?Meta展示的技術(shù)藍(lán)圖,要真正支撐起扎克伯格編織的虛擬世界未來,尚需要一些時(shí)間。
硬科技
在這里看見、讀懂和連接硬科技。聚焦光電芯片、人工智能、航空航天、生物技術(shù)、新能源等8大硬科技產(chǎn)業(yè),依托智慧芽獨(dú)特的科技情報(bào)數(shù)據(jù)優(yōu)勢,讓讀者看見技術(shù)趨勢,讀懂硬科技產(chǎn)業(yè),連接創(chuàng)新未來。智慧芽創(chuàng)新研究中心出品。