權(quán)威力作!上海科技大學(xué)/理論大佬Kirsten M. ?. Jensen再發(fā)子刊!
秋去冬來,北風(fēng)凜冽,科研人宅在實(shí)驗(yàn)室搗鼓實(shí)驗(yàn);
寒來暑往,四季更替,計(jì)算人貓?jiān)陔娔X前撥弄數(shù)據(jù)!
Nature Communications:基于吸附化學(xué)環(huán)境的多相催化機(jī)器學(xué)習(xí)框架

多相催化反應(yīng),受到原子尺度因素微妙的相互作用的影響,從催化劑的局部形態(tài)到高吸附劑覆蓋率的存在。通過計(jì)算模型描述這種現(xiàn)象,需要生成和分析大空間的原子構(gòu)型。在此,為了解決這一挑戰(zhàn),來自美國(guó)特拉華大學(xué)的Siddharth Deshpande &?普渡大學(xué)的Jeffrey Greeley提出了基于吸附物化學(xué)環(huán)境的圖卷積神經(jīng)網(wǎng)絡(luò)(ACE-GCN),一種篩選工作流,考慮了包括不同吸附物、結(jié)合位置、配位環(huán)境和基底形態(tài)的原子構(gòu)型。利用這個(gè)工作流程,研究者為兩個(gè)說明性系統(tǒng)開發(fā)了催化劑表面模型:(i) NO吸附在Pt3Sn(111)合金表面,這與硝酸鹽電還原過程有關(guān),其中高吸附劑覆蓋層結(jié)合合金基底的低對(duì)稱性產(chǎn)生了一個(gè)大的構(gòu)型空間;(ii) OH*吸附在階梯Pt(221)小面上,與氧還原反應(yīng)有關(guān),其構(gòu)型復(fù)雜性源于不規(guī)則晶體表面的存在、高吸附劑覆蓋層和定向依賴的吸附劑-吸附劑相互作用。在這兩種情況下,ACE-GCN模型只訓(xùn)練了DFT弛豫構(gòu)型的一小部分(~10%),成功地描述了從大構(gòu)型空間中采樣的非松弛原子構(gòu)型的相對(duì)穩(wěn)定性趨勢(shì)。這種方法,有望加速對(duì)原位條件下催化劑表面的嚴(yán)格描述的發(fā)展。

參考文獻(xiàn):
Ghanekar, P.G., Deshpande, S. & Greeley, J. Adsorbate chemical environment-based machine learning framework for heterogeneous catalysis.?Nat Commun?13, 5788 (2022). https://doi.org/10.1038/s41467-022-33256-2
原文鏈接:
https://www.nature.com/articles/s41467-022-33256-2
2.Nature Machine Intelligence:基于Transformer的蛋白質(zhì)生成與正則化潛空間優(yōu)化

強(qiáng)大的自然語言模型的發(fā)展,提高了學(xué)習(xí)蛋白質(zhì)序列有意義表示的能力。此外,高通量突變、定向進(jìn)化和下一代測(cè)序技術(shù)的進(jìn)步,使得大量的標(biāo)記適應(yīng)度數(shù)據(jù)的積累成為可能。在此,來自美國(guó)耶魯大學(xué)的Smita Krishnaswamy等研究者利用這兩種趨勢(shì),引入了正則化潛空間優(yōu)化(ReLSO),這是一種基于深度變壓器的自編碼器,其特點(diǎn)是高度結(jié)構(gòu)化的潛空間,經(jīng)過訓(xùn)練可以聯(lián)合生成序列和預(yù)測(cè)適應(yīng)度。通過正則化預(yù)測(cè)頭,ReLSO引入了一個(gè)功能強(qiáng)大的蛋白質(zhì)序列編碼器和一種有效的適應(yīng)度景觀遍歷的新方法。使用ReLSO,研究者顯式地對(duì)大型標(biāo)記數(shù)據(jù)集的序列-函數(shù)景觀建模,并使用基于梯度的方法在潛在空間內(nèi)進(jìn)行優(yōu)化,從而生成新分子。研究者在幾個(gè)公開可用的蛋白質(zhì)數(shù)據(jù)集上評(píng)估了這種方法,包括抗拉尼珠單抗和綠色熒光蛋白的變體集。研究觀察到,與其他方法相比,使用ReLSO具有更大的序列優(yōu)化效率(每個(gè)優(yōu)化步驟的適應(yīng)度增加),在其他方法中,ReLSO更健壯地生成高適應(yīng)度序列。此外,聯(lián)合訓(xùn)練的ReLSO模型學(xué)習(xí)到的基于注意力的關(guān)系,為序列級(jí)別的適應(yīng)度歸因信息提供了一個(gè)潛在的途徑。

參考文獻(xiàn):
Zhaobo Zhou, Junjie He, Thomas Frauenheim, Oleg V. Prezhdo, and Jinlan Wang.?Control of Hot Carrier Cooling inLead Halide Perovskites by Point Defects.?Journal of the American Chemical Society?Article ASAP DOI: 10.1021/jacs.2c08487
原文鏈接:
https://pubs.acs.org/doi/10.1021/jacs.2c08487
3.npj Computational Materials:(001)氧化物超晶格的涌現(xiàn)拓?fù)鋺B(tài)
氧化物異質(zhì)結(jié)構(gòu),表現(xiàn)出許多有趣的特性。在此,來自上海科技大學(xué)的Gang Li & 華東師范大學(xué)的Hanghui Chen等研究者,提出了在(001)(AMO3)1/(AM’O3)1氧化物超晶格中誘導(dǎo)多種拓?fù)鋺B(tài)的設(shè)計(jì)原則。通過第一性原理計(jì)算和模型分析,研究者發(fā)現(xiàn)a (SrMO3)1/(SrM’O3)1超晶格(M = Nb, Ta和M’= Rh, Ir)是Z2指數(shù)(1;001)的強(qiáng)拓?fù)浣^緣體。更值得注意的是,a (SrMO3)1/(SrM’O3)1超晶格具有多重共存的拓?fù)浣^緣體(TI)態(tài)和拓?fù)涞依税虢饘?TDS)態(tài)。TDS態(tài)在費(fèi)米能級(jí)附近有一對(duì)ii型狄拉克點(diǎn)和對(duì)稱保護(hù)狄拉克節(jié)點(diǎn)線。表面TDS狄拉克錐在能量動(dòng)量空間中被兩個(gè)表面TI狄拉克錐夾在中間。非平凡拓?fù)湫再|(zhì)來自于兩個(gè)不同的過渡金屬原子d軌道之間的帶反轉(zhuǎn)和(001)超晶格幾何的特殊宇稱性。該工作演示了如何通過合理設(shè)計(jì),在(001)鈣鈦礦氧化物異質(zhì)結(jié)構(gòu)中誘導(dǎo)非平凡拓?fù)鋺B(tài)。

參考文獻(xiàn):
Liu, Z., Liu, H., Ma, J.?et al.?Emergent topological states via digital (001) oxide superlattices.?npj Comput Mater?8, 208 (2022). https://doi.org/10.1038/s41524-022-00894-5
原文鏈接:
https://www.nature.com/articles/s41524-022-00894-5
4.npj Computational Materials:非松弛結(jié)構(gòu)松弛能量圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的數(shù)據(jù)增強(qiáng)

由于計(jì)算能力和晶體結(jié)構(gòu)預(yù)測(cè)算法(CSPA)的進(jìn)步,計(jì)算材料的發(fā)現(xiàn)在過去十年中有了很大的發(fā)展。然而,CSPA所需從頭計(jì)算的計(jì)算成本,將其效用限制在小單元,減少了算法可以探索的成分和結(jié)構(gòu)空間。過去的研究通過利用機(jī)器學(xué)習(xí)來預(yù)測(cè)材料的穩(wěn)定性,繞過了不必要的從頭計(jì)算。具體來說,在松弛結(jié)構(gòu)的大型數(shù)據(jù)集上訓(xùn)練的圖神經(jīng)網(wǎng)絡(luò),在預(yù)測(cè)地層能量時(shí)顯示出了高保真度。不幸的是,CSPA生成的結(jié)構(gòu)幾何圖形偏離了松弛狀態(tài),導(dǎo)致預(yù)測(cè)效果不佳,阻礙了模型過濾不穩(wěn)定物質(zhì)的能力。在此,來自美國(guó)佛羅里達(dá)大學(xué)的Jason Gibson & Ajinkya Hire & Richard G. Hennig等研究者,為了糾正這種行為,提出了一種簡(jiǎn)單的、物理驅(qū)動(dòng)的、計(jì)算效率高的擾動(dòng)技術(shù),該技術(shù)增強(qiáng)了訓(xùn)練數(shù)據(jù),將對(duì)非松弛結(jié)構(gòu)的預(yù)測(cè)提高了66%。最后,研究者展示了這種誤差減少是如何加速CSPA的。

參考文獻(xiàn):
Gibson, J., Hire, A. & Hennig, R.G. Data-augmentation for graph neural network learning of the relaxed energies of unrelaxed structures.?npj Comput Mater?8, 211 (2022). https://doi.org/10.1038/s41524-022-00891-8
原文鏈接:
https://www.nature.com/articles/s41524-022-00891-8
5.npj Computational Materials:利用可解釋機(jī)器學(xué)習(xí)從納米結(jié)構(gòu)的對(duì)分布函數(shù)數(shù)據(jù)中提取結(jié)構(gòu)基序

利用X射線或中子散射來描述材料結(jié)構(gòu),例如使用對(duì)分布函數(shù)(PDF)分析,通常依賴于根據(jù)實(shí)驗(yàn)數(shù)據(jù)集細(xì)化結(jié)構(gòu)模型。然而,確定一個(gè)合適的模型,往往是一個(gè)瓶頸。最近,自動(dòng)化方法已經(jīng)可以為每個(gè)數(shù)據(jù)集測(cè)試數(shù)千個(gè)模型,但這些方法計(jì)算成本高,分析輸出(即以有意義的方式從結(jié)果擬合中提取結(jié)構(gòu)信息)具有挑戰(zhàn)性。在此,來自丹麥哥本哈根大學(xué)的Kirsten M. ?. Jensen等研究者,基于機(jī)器學(xué)習(xí)的Motif Extractor?(ML-MotEx),在數(shù)千個(gè)擬合上訓(xùn)練ML算法,并使用SHAP?(SHapley Additive exPlanation)值來識(shí)別哪些模型特征對(duì)擬合質(zhì)量重要。研究者將該方法用于4種不同的化學(xué)體系,包括無序納米材料和簇。ML-MotEx可用于一種建模類型,其中模型中的每個(gè)特征都被分配一個(gè)基于可解釋ML的擬合質(zhì)量的重要值。
參考文獻(xiàn):
Anker, A.S., Kj?r, E.T.S., Juelsholt, M.?et al.?Extracting structural motifs from pair distribution function data of nanostructures using explainable machine learning.?npj Comput Mater?8, 213 (2022). https://doi.org/10.1038/s41524-022-00896-3
原文鏈接:
https://www.nature.com/articles/s41524-022-00896-3