手机浏览器扫描二维码访问
孟繁岐的这番话,听起来让人觉得不是那么舒服。
言下之意,给人一种华国aI技术就是不如国外的感觉。
这是李彦弘不大喜欢的,毕竟他这么早就关注aI技术,就是为了研最前沿最先进的技术。
孟繁岐大概猜到了他的想法,前世他也曾被早期华国大量表的aI论文所迷惑。
觉得在这个崛起的技术上,华国已经可以和美国分庭抗礼,不落下风。
虽然a1phago震惊了世人,但毕竟有些华而不实。
直到上千亿级别的语言大模型出现,这种纯硬核实力的比拼,让孟繁岐不得不甘拜下风。
实际上,并非是技术手段和算法层面上相差太远。
更多的还是因为优质数据的数量不足。
白度的文心一言,出图的时候甚至会将用户的中文输入翻译成英文,再去作图。
很多较真的网友故意测试了中英文差异很大的词汇,比如总线(Bus),鼠标(mouse)。
文心一言绘出的图像竟然是大巴车和老鼠,这从中文上是完全说不通的事情。
可见即便不是全部,文心一言这个所谓的专注中文的级大模型,也在相当程度上借助了英文基础的模型权重和技术。
究竟为何要这么做,说到底还是基础不够扎实牢靠。
整理数据,清洗数据,给数据打上高质量的标签。
这些都是脏活累活,见效慢的工作。
把别人公开的数据拿过来跑一跑训一训,多么方便快捷?
以国内996大厂的内卷风气,很难容下长回报周期的基础建设。
早些时候看看不出区别,只觉得国内大厂频繁在xx榜单上露面,刷榜,又是过这个,又是过那个。
直到语言大模型阶段,基础语料数量和质量上的劣势才暴露无遗。
“其实这也不能完全怪华国的大厂风气,美国的互联网起步要早,并且很多领域的文献材料归档做得特别好。”孟繁岐也曾仔细思索过这方面的问题。
“像github,arxiv这样的大型公开社区,里面都是非常优质的外文代码或者论文。这些也不只是美国人自己的积累。而是通过免费公用的形式,收割了全世界的数据。”
“华国人在github上贡献的代码行数也不在少数,反过来看看华国的论文社区,就比如知网,纯纯就是毒瘤。里面屯点硕博生的论文,还要论页数收费。就连下载之后的阅读器,甚至都需要专门的....”
此消彼长之下,差了多少珍贵的数据啊...
只是此时此刻,李彦弘应该还没有想到这么大规模的数据用于训练。因而孟繁岐也不急于一时和他讨论后面语言类的技术,以及生成式的大模型。
不圣母女主忠犬男主修仙大佬一朝穿越,竟成了全家嫌弃的豪门真千金。说我灾星?给你一道霉运符,让你们看看谁是灾星!偷我气运?让你看看天生灵根的威力!驻颜符财运符健康符应有尽有!想要吗?不要998,只要跪下喊一声爸爸!顾离在异世顺风顺水颠倒乾坤,但这个跟她纠缠了两辈子的孽缘男人,到底是怎么回事?!气运被夺,真千金玄术炸翻娱乐圈...
作品简介刘明身患绝症,末路之际幸得贵人相助,侥幸的骨髓移植成功,他摇身一变成了商界大亨的私生子!身背惊天秘密,他潜伏在了御姐上司的身边,做起了贴身男秘!ampampampamp1tpampampa...
(单女主,无系统,搞笑轻松,架空!)一朝穿越,只想平安苟生存的6君弃却与人人避之不及的顶级反派梅清离成了夫妻。面对武艺高强,天下无敌的霸道老婆,6君弃呵呵一笑。既然夫人这么厉害,那为夫便要猥琐育了!此后,夫人在上他在下,夫人杀人他递刀!一声,夫人,救我!!,荡尽天下无敌!杀伐果断美女攻vs能屈穿书后,夫人总想对我图谋不轨...
简介关于重生九零寻仇辣姐当家!双重生Vs忠犬小弟独宠辣姐打女慕一念山中遇害重生三年后,做梦都想报仇雪恨,却被身边一堆甩都甩不掉的拖油瓶绊住脚。日子已经过的举步维艰,半道又捡回个‘黏人精’小弟袁心野。慕一念从此化身为大家长,为了让弟弟妹妹出人头地,以家致富为己任,哪怕是在想方设法追凶寻迹的路上,也能寻仇致富两不误。好不容易混出个人样了,谁知每天屁颠屁颠追着她跑的小野却开始不对劲...
一觉醒来,张小剑穿越到平行世界的高中时期。世界灵气复苏,全民修炼。张小剑觉醒一头C级灵兽皮皮虾,成为一名普通御海师,然而当他开启了一个系统之后叮,养生拳修炼成功!叮,开山炮拳修炼成功!叮,火炮拳修炼成功!叮张小剑一拳轰出,面前的海水尽数撕裂左右分开,凭空出现了一条真空通道!恐怖的力量形成了一道灵力冲击波,浩浩荡荡的把千米之外一头百米长,披着重甲的巨齿鲨轰成肉渣!海床塌陷,大地颤抖。世界,仿佛要被毁灭了!...
简介关于九零大力甜妻带灵泉空间家了如果能重生一次你会怎么做?田宁的答案是为自己而活!重生回到9o年代末,田宁再一次面对偏心黑心的爷奶,软弱无为的父母,她目标明确,好好学习,获得财务自由,活出自己独有的风采。...