第一作者:Quan Zhou、Peizhe Tang、Shenxiu Liu
通訊作者:Shou-Cheng Zhang
通訊單位:斯坦福大學
研究亮點:
1. 提出Atom2Vec,機器可以從已知化合物和材料的龐大數據庫中自己學習原子的基本屬性。
2. 使用原子向量作為神經網絡和其他機器學習模型的基本輸入單元,這些模型被設計和訓練以預測材料屬性,展示了顯著的準確性。
在過去的20年中,通過實驗探索和數值模擬,在材料科學中積累了前所未有的大量數據。龐大的數據集還需要基于數據的統計方法來實現。因此,出現了一種新的范例,旨在利用人工智能(AI)和機器學習(ML)技術來輔助材料的研究和發現。
盡管到目前為止取得了成功,但這些工作在很大程度上依賴于研究人員明智地選擇相關描述,因此,從理論的角度來看,智力程度仍然非常有限。實際上對于機器來說,額外的計算通常是不可避免的,以解釋和理解這些以抽象的人類知識形式存在的原子描述符號。
有鑒于此,斯坦福大學的Shou-Cheng Zhang教授為了創建更高級別的AI并克服實際限制,提出了Atom2Vec,它允許機器從數據中學習他們自己的原子知識。
圖1. Atom2Vec從材料數據庫中學習原子的工作流程
Atom2Vec僅考慮材料數據庫中化合物的存在,而不考慮材料的任何特定屬性。這個龐大的數據集以無人監督的方式用于材料科學的學習。由于缺少材料屬性標簽,Atom2Vec不會偏向于某個方面。因此,只要數據集足夠大且具有代表性,所學習的知識原則上可以產生原子完整和通用的描述。
Atom2Vec遵循核心思想,即原子的屬性可以從它所處的環境中推斷出來,這類似于語言學中的分布假設。在化合物中,每個原子可以被選擇作為目標類型,而環境是指所有剩余的原子以及它們相對于目標原子的位置。直觀地說,類似的原子傾向于出現在相似的環境中,這使我們的Atom2Vec能夠從原子和環境之間的關聯中提取知識,然后以矢量形式表示它。
所學習的特征向量不僅很好地捕捉了向量空間中原子的相似性和性質,而且在用于材料科學的ML問題時也顯示出它們優于簡單經驗描述符的優越性。預計其有效性和廣泛的適用性可以極大地推動當今材料科學中的數據驅動方法,特別是對于最近提出的深度神經網絡方法。
這里有關于特征學習方法的幾個方向值得在將來探討。例如,元素-環境矩陣可以推廣到更高階的張量,其中額外的階數描繪了組合的不同部分。這樣的張量應該包含比矩陣更精細的信息,如何從這個高階對象中提取特征仍然是一個懸而未決的問題。
此外,更加合理的環境描述對于改進無模型和基于模型的方法都是必要的。必須考慮結構信息,以準確地模擬原子如何結合在一起形成環境或化合物,其中對在遞歸和基于圖形的神經網絡上的發展可能有所幫助。
圖2. 通過無模型方法學習主要元素的原子向量
圖3. 對預測ABC2D6形成能量的主要元素原子向量評估
圖4通過無模型方法和評估半赫斯勒化合物中學習主要群體之外的官能團和元素的原子向量
總之,該研究從已知現有材料的數據庫中引入無監督的原子學習,并通過AI重新發現周期表。研究中的ML模型被設計和訓練以預測材料屬性,展示了顯著的準確性。
參考文獻:
Zhou Q, Tang P, Liu S, et al. Learning atoms for materials discovery[J]. Proceedings of the National Academy of Sciences, 2018: 201801181.
DOI: 10.1073/pnas.1801181115
http://www.pnas.org/content/early/2018/06/25/1801181115.short
更多關于材料方面、材料腐蝕控制、材料科普等方面的國內外最新動態,我們網站會不斷更新。希望大家一直關注中國腐蝕與防護網http://www.ecorr.org
責任編輯:殷鵬飛
《中國腐蝕與防護網電子期刊》征訂啟事
投稿聯系:編輯部
電話:010-62313558-806
郵箱:fsfhzy666@163.com
中國腐蝕與防護網官方 QQ群:140808414
免責聲明:本網站所轉載的文字、圖片與視頻資料版權歸原創作者所有,如果涉及侵權,請第一時間聯系本網刪除。

官方微信
《中國腐蝕與防護網電子期刊》征訂啟事
- 投稿聯系:編輯部
- 電話:010-62313558-806
- 郵箱:fsfhzy666@163.com
- 中國腐蝕與防護網官方QQ群:140808414