呱呱小说

手机浏览器扫描二维码访问

第43章 又双叒叕突破啦(第1页)

孟繁岐的这番话,听起来让人觉得不是那么舒服。

言下之意,给人一种华国aI技术就是不如国外的感觉。

这是李彦弘不大喜欢的,毕竟他这么早就关注aI技术,就是为了研最前沿最先进的技术。

孟繁岐大概猜到了他的想法,前世他也曾被早期华国大量表的aI论文所迷惑。

觉得在这个崛起的技术上,华国已经可以和美国分庭抗礼,不落下风。

虽然a1phago震惊了世人,但毕竟有些华而不实。

直到上千亿级别的语言大模型出现,这种纯硬核实力的比拼,让孟繁岐不得不甘拜下风。

实际上,并非是技术手段和算法层面上相差太远。

更多的还是因为优质数据的数量不足。

白度的文心一言,出图的时候甚至会将用户的中文输入翻译成英文,再去作图。

很多较真的网友故意测试了中英文差异很大的词汇,比如总线(Bus),鼠标(mouse)。

文心一言绘出的图像竟然是大巴车和老鼠,这从中文上是完全说不通的事情。

可见即便不是全部,文心一言这个所谓的专注中文的级大模型,也在相当程度上借助了英文基础的模型权重和技术。

究竟为何要这么做,说到底还是基础不够扎实牢靠。

整理数据,清洗数据,给数据打上高质量的标签。

这些都是脏活累活,见效慢的工作。

把别人公开的数据拿过来跑一跑训一训,多么方便快捷?

以国内996大厂的内卷风气,很难容下长回报周期的基础建设。

早些时候看看不出区别,只觉得国内大厂频繁在xx榜单上露面,刷榜,又是过这个,又是过那个。

直到语言大模型阶段,基础语料数量和质量上的劣势才暴露无遗。

“其实这也不能完全怪华国的大厂风气,美国的互联网起步要早,并且很多领域的文献材料归档做得特别好。”孟繁岐也曾仔细思索过这方面的问题。

“像github,arxiv这样的大型公开社区,里面都是非常优质的外文代码或者论文。这些也不只是美国人自己的积累。而是通过免费公用的形式,收割了全世界的数据。”

“华国人在github上贡献的代码行数也不在少数,反过来看看华国的论文社区,就比如知网,纯纯就是毒瘤。里面屯点硕博生的论文,还要论页数收费。就连下载之后的阅读器,甚至都需要专门的....”

此消彼长之下,差了多少珍贵的数据啊...

只是此时此刻,李彦弘应该还没有想到这么大规模的数据用于训练。因而孟繁岐也不急于一时和他讨论后面语言类的技术,以及生成式的大模型。

热门小说推荐
什么叫Carry型上单啊

什么叫Carry型上单啊

极致的对线压制无解的团战能力果决缜密的团队决策李汉升回到S6,他便势要将混子英雄踢下LPL上路幻神的宝座。李汉升用自己的整个职业生涯完美的诠释什么叫carry型上单。PS简介无力,请大家直接观看正文,比赛直播整活为主群号305676180...

堕落的白月光

堕落的白月光

简介关于堕落的白月光无固定cp非双洁疯批男主多男主打脸无系统重生高洁慎入!你知道白色山茶花的花语吗?你怎敢轻视我对你的爱。一场上位者的游戏,充满爱欲交恨情仇,一张情欲的大网将她笼罩住,最终她撕开那张裹挟住自己的巨网,将他们一个个玩弄于股掌之中。夏晚星被艺术天才奉为灵感缪斯,凭借着一张漂亮脸蛋进入了校园圈的金字塔尖,初次爱恋的她看不透众人的异样心思,在一段段的感情里成长蜕变。他们都说她是烂透了的白月光,说她从校园女神沦落为职场交际花,但她根本不在意这些标签。故事的开局是一场名为青春之旅,少男少女们展开故事情节,爱情并不是青春的代名词,只是浓墨重彩中的一笔。...

梦寻春秋

梦寻春秋

简介关于梦寻春秋这是一部集历史穿越玄幻悬疑爱情科幻和武打为一体的长篇章回小说。故事情节跌宕起伏,引人入胜,精彩纷呈,非常值得广大读者阅览的优秀长篇章回小说。...

温蔓霍绍霆小说全本免费阅读

温蔓霍绍霆小说全本免费阅读

一场酒醉,她招惹上大人物,她有求于他,他贪图她年轻身材好。时间久了,她才知道他心里有人,当他的白月光归来,他渐渐不再回家,温蔓守着空房,度过无数个没有他的夜晚,后来,她等到一张支票和他的一声再见。本以为她会哭闹,她却拿着支票利落走人霍先生,我们后会无期!再次重逢,她身边有了旁人,他红着眼睛说温蔓,明明是我先跟你好的。温蔓笑颜淡淡霍律师,先...

我在妖魔世界悄悄加点升级

我在妖魔世界悄悄加点升级

妖魔世界,一款难度极高的游戏。苏南意外接触到游戏,并获得了一种预知未来三分钟的能力,凭借这个能力,原本高难度的游戏在他眼中变得简单。正当苏南以为自己将会在游戏中大展拳脚时,却现种种迹象表明,自己玩的游戏并不简单。失控的玩家,不死的人魔,夺舍而来的妖物各种不可思议的事情接踵而来,现实世界逐渐变得诡异。察觉到身边的危险,苏南果断决定悄悄育,先定个小目标,成为游戏中的第一玩家。...

残疾大佬的卷王之路

残疾大佬的卷王之路

残疾大佬的卷王之路...

每日热搜小说推荐