呱呱小说网

手机浏览器扫描二维码访问

第14章 万事俱备(第2页)

a1exnet是八层的结构,各自有一些独立的设计,在此时,8层已经是革命性的深度网络了。

更深的网络特别难以训练,因此原本直到14年,谷歌和牛津才分别把这个深度推进到22层和19层。……

更深的网络特别难以训练,因此原本直到14年,谷歌和牛津才分别把这个深度推进到22层和19层。

而Resnet的思想,彻底从根本上解决了网络变深就没法顺利训练的问题。它让5o,1oo,15o,甚至1ooo层网络的训练成为可能。

“从去年的8,到今年的1oo+层,甚至1ooo层也可以训练。在2o13年的视角来看,这一剂猛药应该够劲了。”

不仅是深度上取得了开创性的突破,Resnet的性能也同样惊人。它是第一个Top-5错误率低于人类能力的结构,单模型达到了4.6%左右。

如果综合几个不同方式训练的Resnet,平均他们的输出再去预测的话,其Top-5错误率甚至低至3.7%。

“其实在ImageneT上做得太准了反而是一件怪事。”考虑到后世的研究中,该数据集中的标签其实有不小的比例是错误的,越贴近百分之百的准确率反而越有一些荒诞的感觉。

Resnet的Res指residua1,正经点说是残差,说得明白一些是一种短路或者是跳跃链接。

再说的浅显一点,假设原本的操作为f(x),Resnet就是把计算过程从f(x)改为f(x)+x。

这也是孟繁岐最早与付院长讨论的内容之一。

这种不带任何参数的支路链接,直接把操作前的内容加到操作后的内容上,是深度网络突然能够在上千层的深度下收敛的秘密所在。

在此之后的几乎所有aI文章,都很难绕得开这个思路。kaiming本人单就这一篇文章,就在六七年的时间内收获了十五六万的文章引用。

不得不说这是一个天文数字。要知道即便是naturenetce三大世界级顶刊常客,著名华国美国双料科学院士抽出一个来,至今为止所有文章的总引用数量加在一起五万多都算是多的了。

当然了,单以论文被引用的次数来评价文章的水平和作者的水平是有失偏颇的。

很多基本学科曲高和寡,看得人少写得人也少。引用自然就上不去。

但就aI这个实用性实验性比较强的学科来说,内部去对比的话,引用的多少含金量还是相当之高的。

大家只会用代码投票,有价值的东西会一直迭代下去。有利于自己模型在任务上性能提升的技术,则会被一直引用下去。

学术界一直有这样的说法,搞理论的和搞实验的两边相互看不起。这倒也不是无中生有。

kaiming凭借几篇代表作奠定自己历史地位后,就总有个别人喜欢说什么“Resnet的思想早就有人提过了”,“几十年前的东西不算什么东西”,“这篇文章也就是流量大罢了,和流量明星是一样的”。

酸味都要溢出屏幕了。

孟繁岐不是没读过一些理论类的文章,但他个人觉得时代的aI,ta1kischeap,shomethecode。你说几十年前就有的东西,怎么不写一个Resnet突破人类水准呢?

Resnet的核心代码难写吗?不难的。

基于a1ex的框架,只需几个小时的时间,他就可以基本复现出Resnet论文中的所有结构。

弱小和无知不是生存的障碍,傲慢才是。

本章完

热门小说推荐
年代娇美人,科研大佬宠妻无度

年代娇美人,科研大佬宠妻无度

穿越后,姜瑜现自己是多余的,爹不亲妈不爱,家里的小透明。没有金手指,没有空间。这个没关系,她有个很厉害的便宜老公!在这个过去的年代,她努力学习考大学,带着帅老公一起过美满幸福的生活!本文架空,请勿上升现实!...

绝顶高手在都市

绝顶高手在都市

作品简介再说一遍,你赶快给我下山找个压寨夫人!一个?你确定我只能找到一个?我长得这么英俊潇洒,风流倜傥,怎么可能只找到一个?我要找一大群压寨夫人,然后给你们生成千上万的徒子徒孙,折磨死你们。看你们以后还敢逼着我下山找压寨夫人。喂,哪个美女,做我压寨夫人好不好啊?滚!!!...

放怪物一条生路不行吗

放怪物一条生路不行吗

作品简介穿过丛丛荆棘越过错杂迷宫解决重重谜团,一步一步靠近终极Boss,通关结局就在眼前,寻找到回家的道路。但是金缎啤酒一月余烬海西梅脯锅茉莉香茶...

骗了康熙

骗了康熙

九龙夺嫡最紧要的关头,九门提督隆科多的私生子,把康熙骗惨了!...

世子青梅又戏精了吗

世子青梅又戏精了吗

简介关于世子青梅又戏精了吗建议不要看本文,这本写的最差)转世古代的酥酥,软萌无害众人觉得好可爱庶女我的刀,我的鞭子呢小奶包奶音软软的笑都不许和酥酥,抢冥冥呐不然,弄死你们呀...

柳逆洪荒

柳逆洪荒

作品简介柳烽穿越洪荒,竟然变成一株柳树,好在他激活了离线挂机系统,挂机就送功德。开局奖励亿万功德,修神通,结大能,搅动洪荒,镇杀罗睺。跟脚太低?只是普通柳树?直接百亿功德提升成无上时空剑柳!女娲妹妹造人成…...

每日热搜小说推荐