肖宿站在屏幕前,將整个模型从头到尾扫了一遍。
赵简站在他身旁,有些紧张地看著他的表情。
这个计算模型是他和他的团队花了整整三年时间搭建起来的,期间经过了七次大版本叠代,融入了航天科工过去几十年积累的海量实验数据和近百万组第一性原理计算样本,在行业內已经算是首屈一指的材料设计平台了。
他们自己內部评价的时候,用的词可都是国內领先、国际先进。
但是肖宿看完之后,却只是很轻地皱了一下眉。
“模型没有错,但是还不够精准。”
赵简的心先是提了一下,然后又悬了起来。
什么叫还不够精准
他指著屏幕上的一组预测值与实测值对比曲线,说道:
“比如这里,热膨胀係数的预测曲线在三百度到四百度的区间里和实测值的偏差超过了百分之十五,很明显是神经网络在数据稀疏区域的泛化能力不足,你们在这个温度区间里的训练样本不够多,模型只能靠外推,外推误差天然就大。”
赵简看著屏幕上那条偏差明显的曲线,脑子里嗡嗡作响。
肖宿指出的这个偏差,他当然知道。
事实上,为了这个偏差,他带著团队调了好几轮模型参数,换了好几种神经网络架构,甚至还尝试过用迁移学习从相似材料体系借数据来补,但效果始终不理想。
他一直以为这是数据量不够的问题,需要再跑几万组分子动力学模擬才能慢慢补上来。
可肖宿接下来说的话,让他意识到自己可能从根本上就想错了方向。
“而且,你们这个模型的骨架太笨重了。
几十个维度同时优化,每一个维度的预测都需要独立的特徵提取和模型训练,耦合项的处理用的是简单的特徵交叉,这种方法在维度低的时候可以,维度一高,耦合项的规模就会指数级膨胀,优化过程会陷入大量的局部极小值,最终得到的不是全局最优解,而是某个局部最优解的近似。”
他一边说,一边拉过键盘,在赵简还没反应过来之前,已经熟练地打开了一个新的代码窗口。
赵简的眼睛瞪得溜圆:“肖教授,您这是……”
“重新写一个。”
这话一出,整个车间里鸦雀无声。
周飞寧手里的文件夹都差点掉地上了。
现在都流行一言不合就从头开造吗
可下一秒,所有人都不约而同地想起了之前那个轰动全球学术界的化学计算模型。
肖宿仅凭一己之力,就推翻了沿用四十年的dft密度泛函理论框架,建起了全新的几何电子结构计算体系,又帮万匯杨的课题组做出了geosculpt。
那款软体一出,直接碾压了vasp这些老牌工业软体,分子模擬速度提升四倍,精度拉高了一个量级,全球的顶尖实验室、化工巨头、药企全被震动了,计算化学的行业上限又被重新画了一道线。
所以说,现场手搓一个全新的计算框架什么的,应该,大概,也许,很正常的吧……
赵简站在肖宿身后,看著他打开一个新的代码窗口,修长的手指落在键盘上,几乎没有停顿。
“自由能泛函的形式定了之后,第一步是序参量的选择。”
敲代码的声音清脆而连续,在安静的车间里清晰地传到所有人的耳中。