第9章 徒儿已经全部忘记了-《重生之AI教父》
第(1/3)页
“这到底是怎么个扑朔迷离的剧情?”
早先见电气学院的导员气势汹汹的找来,还以为这小子是个问题学生。
怎么就峰回路转,变成如此高深专业的讨论了?
我是谁?我在哪?他们到底在说什么?
为什么每个字我都认识,连在一起我就完全听不明白了?
时间缓缓地流逝,不知不觉间,付院长的草稿和推演已经写满了六七页a4纸。
“如果单纯用y=f(x)+b的方式去理解一层的行为,那么对于任意正整数k,都存在一个k^3量级深,常数量级宽的神经网络,无法被一个k层的神经网络拟合,除非其宽度为原本的2^k倍。”
付院长越计算,越觉得这小子的直觉不错。
“倘若依你所说,用批次归一化的方式去避免协变量偏移的问题,再加上非线性的函数为层提供额外的表达能力,那么甚至在极端的情况下,需要2^k^3倍的宽度。这样看来你首先专注于解决深度问题,然后考虑去处理训练难度问题的思路是相当聪明的选择。”
付院长,沉吟了一番,回顾了一下自己的计算过程,问道“懂了吗?”
孟繁岐非常严肃认真地摇了摇头,说“没太懂。”
付院长笑了笑,不急不恼,又将整个流程按顺序梳理了一遍。
即便孟繁岐前世已经精读过好几次这三篇论文,但始终没能从根本上理清其中的数学关系。ai界与数学界看待这个问题的视角截然不同,付院长带给了孟繁岐新的认识和理解。
有一位资深的数学教授为他梳理了背后的数学原理和关系,孟繁岐顿觉豁然开朗,但却又始终迷迷蒙蒙,隔着一层纱布。
仔细再看良久,好像有些明了了,“现在好像有些懂了。”
第(1/3)页