五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

10.29想法隨記

2020-10-30 00:53 作者:君莫舔  | 我要投稿

今天被馬博士問到,既然我想靠AI數(shù)據(jù)博取名聲,那總得有個(gè)具體點(diǎn)的博法吧?

?

? ?我的第一反應(yīng)吧,確實(shí)是官面話——“幫公司輔助一個(gè)牛逼的產(chǎn)品出來,人們用到這個(gè)產(chǎn)品覺得牛逼,那我這個(gè)曾經(jīng)在數(shù)據(jù)上支持過該產(chǎn)品的人也與有榮焉嘛。”

?

? ?套話自然被馬博士揭穿。

?

? ?蔣博士也適時(shí)非常陰險(xiǎn)[滑稽]地補(bǔ)刀——“那我說都是因?yàn)樗惴ㄅ1蒲?..反正我從別人那聽到的都是說算法牛逼的,沒有說數(shù)據(jù)牛逼的~”

?

? ? 我當(dāng)時(shí)心里吐槽,這話真是......我張口也能說:我反正從吧啦吧啦各種名企高管那里聽到的都是說數(shù)據(jù)牛逼(沒吹牛逼,真的有哈)~

?

? ?然而這么去扯是永遠(yuǎn)爭不出什么名堂的。

?

? ?下來我也跟**和**吹:“咱換一個(gè)思路,要證明我們牛逼,那只要讓對(duì)手的不牛逼不就行了嘛?!?/p>

?

? ?“那你怎么去證明那些數(shù)據(jù)不牛逼啊?”

?

???靈魂發(fā)問。

?

? ?...實(shí)際上吧,其實(shí)不用科學(xué)地去證明什么,畢竟說服大眾的方法,并非只有拿“道理”去論證,大眾的接受理由很多時(shí)候其實(shí)沒有那么“嚴(yán)謹(jǐn)”。方法很多,不止黑和白。

?

? ?當(dāng)然,就追勢(shì)現(xiàn)在的體量,講真,也還沒走到紫禁之巔的那步。競爭上并沒有激烈到需要這類手段并用的程度。

?

? ?那就此打住。

?

? ? 回歸正題,說說我的看法——

?

? ?算法、算力和數(shù)據(jù)是拉動(dòng)人工智能前進(jìn)的三駕馬車。

?

? ?從運(yùn)算智能到感知智能以及認(rèn)知智能,算法是非常核心的組成部分。不過近年來AI在算法上并沒有實(shí)現(xiàn)飛躍性的進(jìn)展(全球)。部分原因是,在一些任務(wù)中,該類技術(shù)所取得的成果并沒有顯著增加。例如,在圖像識(shí)別方面,計(jì)算機(jī)在完成了對(duì)人類的超越以后,便沒有更多的建樹。這也反映了一個(gè)事實(shí),即:有待解決的問題越來越難,進(jìn)展也越來越慢。

?

? ?姚期智院士在22號(hào)的“2020浦江創(chuàng)新論壇全體大會(huì)”上也提到過——機(jī)器學(xué)習(xí)算法缺乏可解釋性,很多算法處于“黑盒子”狀態(tài)。如一個(gè)科研團(tuán)隊(duì)開發(fā)了一個(gè)房地產(chǎn)估價(jià)系統(tǒng),系統(tǒng)通過算法學(xué)習(xí)了各地房地產(chǎn)價(jià)格大數(shù)據(jù),從而能自動(dòng)評(píng)估房地產(chǎn)價(jià)格。然而,這套算法像黑盒子一樣,很難給出估價(jià)的完整依據(jù)。這在商業(yè)應(yīng)用上是短板。算法的可解釋性問題亟待科研突破。

?

? ?提這兩個(gè)例子想說啥呢,就是,縱然我們也在不斷努力優(yōu)化算法,研究算法。但時(shí)至今日的情況是,取得突破性進(jìn)展是非常非常困難的,有一道甚至好幾道瓶頸擋在路前。

?

? ?當(dāng)然,這對(duì)稍微落后的團(tuán)隊(duì)追擊先頭部隊(duì)提供了機(jī)會(huì)。大膽四舍五入一下,算法上,大家花不了太多時(shí)間又能匯集到同一水平線上來了。

?

? ?再說算力,這個(gè)就我理解跟硬件性能的關(guān)系更大。也不是這篇文章主要要探討的東西,就先略過。

?

? ?最后是數(shù)據(jù)。

?

? ?數(shù)據(jù)在感知和認(rèn)知智能中的應(yīng)用非常廣,需求量也極大,理論上訓(xùn)練數(shù)據(jù)量趨近于無限,模型的效果也會(huì)更優(yōu)。(暫時(shí)沒有強(qiáng)人工智能,而“無監(jiān)督學(xué)習(xí)”在大多新聞報(bào)道里也更多的是和“未來”這個(gè)詞兒一起用的。)

?

? ?近年的話,大多數(shù)做AI產(chǎn)品的企業(yè)對(duì)標(biāo)注數(shù)據(jù)的需求都是巨量的。很多三方供應(yīng)商的競爭力多展現(xiàn)在“我們有多少TB,多少PB量級(jí)的數(shù)據(jù)”上。實(shí)際情況是:問供應(yīng)商某某數(shù)據(jù)有沒有,供應(yīng)商滿口回答有有有。等實(shí)際入場(chǎng)時(shí)才發(fā)現(xiàn),數(shù)據(jù)根本不可用,有些字段錯(cuò)的離譜,有些字段太稀疏,等你做完清洗,剩下的數(shù)據(jù)可能跑個(gè)邏輯回歸都?jí)騿?,根本沒法上深度學(xué)習(xí)。

?

? ?同時(shí)還存在的問題是:數(shù)據(jù)造假,比如本身就是造數(shù)據(jù)的流程上,員工還偷懶再次造假。

?

? ?還有數(shù)據(jù)孤島,有的存在于企業(yè)之間,有的企業(yè)內(nèi)部也因?yàn)椴块T競爭產(chǎn)生,各種手段齊出讓你的效果大打折扣,脫敏、二次加工、延時(shí)等等等等。

?

? ?光是單一任務(wù)模型的訓(xùn)練就需要消耗海量的數(shù)據(jù),而從“任務(wù)驅(qū)動(dòng)”的階段到“條件反射”的實(shí)現(xiàn),人工智能要走的路還很長,需要的標(biāo)注數(shù)據(jù)會(huì)非常多,當(dāng)然,遇到的低質(zhì)數(shù)據(jù)也會(huì)是海量。

?

? ?因此,我認(rèn)為數(shù)據(jù)只看走量和打價(jià)格戰(zhàn)的時(shí)代即將過去,未來隨著需求的精細(xì)化和AI發(fā)展階段的高端、復(fù)雜化,質(zhì)量一定會(huì)成為最重要的評(píng)估指標(biāo)。到這個(gè)時(shí)候才是看標(biāo)注人員的水平、態(tài)度從而反映其競爭力的時(shí)候。

?

? ?寫到這兒,感覺我好像光在闡述數(shù)據(jù)的重要性,而不是應(yīng)題的說怎么搞個(gè)牛逼的數(shù)據(jù)讓人們認(rèn)識(shí)認(rèn)識(shí)。

?

? ?其實(shí)吧,所謂的“AI數(shù)據(jù)走量已經(jīng)接近飽和,現(xiàn)在看的是算法的突破”這類說法我覺得并不全對(duì)。因?yàn)槲易约壕褪歉蓸?biāo)注的(全職、兼職、創(chuàng)業(yè)),我非常清楚那些標(biāo)注數(shù)據(jù)大廠(那些號(hào)稱99.9%的團(tuán)隊(duì)/企業(yè))做的數(shù)據(jù)是個(gè)什么質(zhì)量,最多90分,而且還是極少數(shù)。也就是說所謂的“飽和”其實(shí)是用很多次品數(shù)據(jù)喂出來的。

?

? ?照我看來,牛逼的數(shù)據(jù)就是真正緊密貼合當(dāng)前項(xiàng)目需求的高質(zhì)數(shù)據(jù)。

?

? ?我是可以做的。

?

? ?至于牛逼到讓人們用到/看到/聊到某個(gè)產(chǎn)品就能想到這家公司的程度...那需要的是團(tuán)隊(duì)間的群策群力,而不是某一個(gè)人或部門牛逼或自詡牛逼就能做到的。


????或者,你有什么好的想法嗎?


[2020年11月上傳于追勢(shì)科技內(nèi)網(wǎng)]

10.29想法隨記的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
哈巴河县| 曲松县| 东至县| 兴海县| 西乌珠穆沁旗| 张家界市| 高台县| 连江县| 新乡市| 西乌珠穆沁旗| 鄂州市| 喀喇| 霍山县| 虞城县| 环江| 凌海市| 广宁县| 措美县| 白银市| 类乌齐县| 屏南县| 南川市| 昔阳县| 黄大仙区| 安泽县| 开化县| 兰考县| 黎城县| 芜湖县| 井冈山市| 崇仁县| 吉隆县| 托克逊县| 崇礼县| 大同市| 青铜峡市| 永年县| 新巴尔虎右旗| 木里| 沾化县| 塘沽区|