從AI繪圖說起--科技進(jìn)步與文藝表達(dá)

正如衡量經(jīng)濟發(fā)展水平的指標(biāo)應(yīng)該是社會上的大多數(shù)人生活水平,而非社會首富的財富積累。衡量藝術(shù)文化水平的指標(biāo)應(yīng)該是社會上大多數(shù)人的藝術(shù)素養(yǎng),應(yīng)該是下里巴人,而非單看陽春白雪。
藝術(shù)創(chuàng)作,其基本目的與作用,就是情感、感受的表達(dá)與傳遞。
站在這兩點理論的基礎(chǔ)之上,就可以說,科技進(jìn)步會反作用于人文發(fā)展,其表現(xiàn)形式之一,就是普遍地降低了人們進(jìn)行自我表達(dá)的門檻。
**1.AIGC的發(fā)展**
2022年,從DIsco?diffusion出圈開始,我接觸到了AI繪畫。最開始只是當(dāng)成一個新鮮的玩具隨便玩玩,或許和下了個新游戲差不多的心態(tài)。用百度云下了個別人打包好的DIscodiffusion被告知要花50塊解鎖的時候,真的挺生氣的。咽不下這口氣,沒有任何編程基礎(chǔ)的自己跟著網(wǎng)上的教程下了Git,下了VSstudio,下了Nvidia的CUDA,下了Conda配了Python的環(huán)境,順著天書一般的報錯下程序運行所需的組件,全程所花費的時間價值絕對超過了50塊,但是最終自己用DiscoDiffusion跑出來海岸線上的燈塔的時候,確實挺爽的。
后來又下了Stable?diffusion,下了SD1.4、NovelAILeak這兩個僅有的大模型,跟著瞎跑了千八百張圖,瞎玩。再后來QQ群里傳出了Anything融合模型。再后來大煉金丹,Civitai上大模型到處都是。再后來有了controlnet,實現(xiàn)了深度檢測(實際上SD2.0就有depth版的了)、邊緣檢測等等。再后來有了Lora,角色、畫風(fēng)、特性的傳播更加輕量化。
同期的Midjourney和DALLE2或許有著比SD1.5更優(yōu)越的性能,但是借助著開源所催發(fā)的新生事物的無窮生命力,是極其令人震驚的。Midjourney與DALLE2的發(fā)展如何我不清楚,但SD的發(fā)展說是日新月異可說毫不夸張。
(besides,我有個DALLE2的prompt guide book,其中有不少思路對SD也是適用的,感興趣的話可以在評論區(qū)反應(yīng)下,我之后也許可以再寫一個專欄分享下這個文件)
而本文開頭的這段話,和這幾個例子,就是我在前兩天晚上臨睡前腦子里忽然閃過的。
童年時,我沒有學(xué)過畫畫,常??鄲烙谀X子里有一副非常具象化的畫面,想要表達(dá)出來時,落筆卻成了抽象的涂鴉。現(xiàn)在我坐在電腦前,只需要幾個單詞,就能產(chǎn)出一幅圖像,卻經(jīng)常覺得腦子里空空如也。但腦袋空空是我自己的問題,技術(shù)的進(jìn)步與圖像生成的便捷卻是無可爭議的。只是偶爾會想,倘若我小的時候就有這種技術(shù),或許童年的苦惱會少一個,小時候背單詞的動力也會多一些吧。
順著技術(shù)手段與個人的藝術(shù)表達(dá),我又往回想起了Vocaloid。
**2.Vocaloid**
高中時我第一次在朋友家聽到了他歌單里放的一首洛天依的歌,感興趣之下就去搜了搜。當(dāng)我了解了其歌曲創(chuàng)作形式之后,就對這種形式非常感興趣。當(dāng)時只是覺得,這種每個人都可以頂著這一個小號創(chuàng)作的模式挺有意思的。同樣地,順著下載V3軟件、聲庫,自己試著調(diào)教樂曲,盡管那時我甚至不知道什么叫大調(diào)什么叫音階,只是照貓畫虎搬把譜子上的符號搬到軟件界面的音樂鍵盤中。
但無論如何,我認(rèn)為,對于性格內(nèi)向或五音不全的人來說,Vocaloid技術(shù)的出現(xiàn)為他們在音樂上打開了一扇新的窗戶。同期還有Utau,后續(xù)或許還有AI語音模仿等等。
這無疑也是一種,技術(shù)進(jìn)步助力于人文發(fā)展、降低個人通過藝術(shù)方式進(jìn)行自我表達(dá)的門檻的例子。
**3.合成器**
而順著這個思路,我又往上想起了合成器與電子音樂。
在上個世紀(jì),合成器第一次出現(xiàn)的時候,?人們只需要扭動幾個旋鈕,調(diào)整方波、三角波、正弦波的參數(shù)與比例,就可以捏造出各種各樣的音色。后續(xù)還有各種的采樣、拼貼、合成。這是不是也算是,一種技術(shù)進(jìn)步助力藝術(shù)表現(xiàn)、人文發(fā)展的例子呢?
時至今日,一架精良的三角鋼琴還是需要幾百幾千萬,但如果你只是想自己練習(xí)使用的話,戴上耳機,幾千的雅馬哈電子琴也能給你很不錯的音色和手感。至于電子音樂在流行領(lǐng)域更是登堂入室。
在當(dāng)時的人們合成器的反應(yīng)如何呢?也會像如今這般恐懼合成音色帶來的失業(yè),認(rèn)為是一種沒有靈魂的音樂嗎?我未曾研究過,因而無從得知。
**4.閑話與尾聲**
從上一段的最后一部分也可以看出來,我本來是想繼續(xù)寫一些關(guān)于祛魅與賦魅的話題,講講關(guān)于AI帶來的失業(yè)恐懼的事的。
但是后來想了想,算了,懶得反駁,反正現(xiàn)在AI繪圖和ChatGPT已經(jīng)在實際工作中逐漸應(yīng)用起來了。事實已經(jīng)發(fā)生,辯經(jīng)毫無意義。
但是我又想到了一個特別好的地獄笑話,不寫出來真的很難受。
“既然一幫千萬富翁都能為了探險精神把自己關(guān)進(jìn)一個從外部鎖死的鐵棺材里扔到海底幾千英尺,你為什么不能為了探險精神冒險學(xué)習(xí)一下應(yīng)用AI呢?”