Hugging News #0407: Google AI 的 Pix2Struct 來啦、開發(fā)者資源頁面發(fā)布

每一周,我們的同事都會向社區(qū)的成員們發(fā)布一些關(guān)于 Hugging Face 相關(guān)的更新,包括我們的產(chǎn)品和平臺更新、社區(qū)活動、學(xué)習(xí)資源和內(nèi)容更新、開源庫和模型更新等,我們將其稱之為「Hugging News」,本期 Hugging News 有哪些有趣的消息,快來看看吧!
社區(qū)活動
ControlNet 微調(diào)沖刺活動

為了幫助更好地使用 ControlNet 探索 AI 繪畫,我們在全球社區(qū)聯(lián)合 Google Cloud 一起舉辦了這次 ?? JAX / Diffusers 社區(qū)沖刺活動。請在這里?查看本次活動的詳細信息?;顒雍芸炀徒刂箞竺耍俅握\摯邀請參加!
產(chǎn)品更新
新的 Space 應(yīng)用模版: ZenML
ZenML 是一個可擴展的開源 MLOps 框架,為數(shù)據(jù)科學(xué)家、ML 工程師和 MLOps 開發(fā)者創(chuàng)建可移植、生產(chǎn)就緒的 MLOps 管道。你可以選擇使用 Docker 作為 Space 應(yīng)用的 SDK,并選擇 ZenML 作為模版即可。
Not-For-All-Eyes 標簽

我們新添加了“Not-For-All-Eyes”標簽,該標簽將用于標記包含可能不適合所有受眾的內(nèi)容的數(shù)據(jù)集等內(nèi)容。你可以在個人設(shè)置里選擇忽略這個標簽提醒。
開源更新
?? ?? ?????

我們上線了一個專題頁面,列舉了作為軟件開發(fā)者可以使用的 Hugging Face 平臺的資源:
https://hf.co/spaces/huggingface/devs
Google AI 的 Pix2Struct 現(xiàn)已在 ?? Transformers 中提供
Google AI 的 Pix2Struct 現(xiàn)已在 ?? Transformers 中提供,Pix2Struct 是一種預(yù)先訓(xùn)練的圖像到文本模型,用于純視覺語言理解。該模型通過學(xué)習(xí)將網(wǎng)頁的屏幕截圖解析成簡化的 HTML 來進行預(yù)訓(xùn)練。Pix2Struct 還引入了可變分辨率輸入表示和更靈活的語言和視覺輸入集成,其中語言提示(如問題)直接呈現(xiàn)在輸入圖像的頂部。該模型在四個領(lǐng)域的九項任務(wù)中取得了最先進的結(jié)果,包括文檔、插圖、用戶界面和自然圖像。
手把手教你使用 ControlNet

ControlNet 這個神經(jīng)網(wǎng)絡(luò)模型使得用戶可以通過施加額外條件,細粒度地控制擴散模型的生成過程。這一技術(shù)最初由 Adding Conditional Control to Text-to-Image Diffusion Models 這篇論文提出,并很快地風(fēng)靡了擴散模型的開源社區(qū)。來回顧我們本周的文章,學(xué)習(xí)如何使用 ControlNet!
以上就是本周大事件,祝大家有一個愉快的周末!