手机浏览器扫描二维码访问
“原来如此。”陈腾笑了笑,“那这个DH0.1现在大概处于什么样的水准?”
“对话的智力水平……大概只有幼儿园小朋友的水平吧。”
陈腾微微点头。
这个水平,的确不高。
也难怪版本号是0.1,而不是1.0。
“你觉得如果我们这个DH0.1如果需要提升,目前最欠缺的是什么?”
“数据。”魏龙毫不犹豫地回答道,“绝对是优质的数据,我们这个模型的水准还是不错的,就是数据实在是太少了。”
“数据吗……”
陈腾倒是没怀疑魏龙说的模型水准。
因为这个DH模型的基础,其实是【LSM人工智能语言学习大模型】。
就是陈腾上次五连抽,在系统上抽到的那个。
系统出品,怎么都不会太差劲的。
在抽到这个大模型之后,魏龙手下的技术团队又基于这个模型做了一定程度上的改进。
所以模型水准陈腾是非常信任的。
不过模型的学习能力强是一回事,数据又是一回事。
如果将模型比作一个人,优秀的模型就是天赋很高的天才。
可就算是顶级的天才,没有高质量的学习资料,能学到的东西也有限。
现在腾达的这个DH模型,缺乏的就是学习资料。
“我们现在的数据源有哪些?”
“就是各大平台上网友们交流的一些数据,比如短视频平台的评论区,直播平台的弹幕。不过这些数据的质量,实在是太低了。”
陈腾微微点头。
魏龙说的很有道理。
短视频平台的评论区,有相当多的一部分评论都是没什么意义的回复。
这个没意义,指的是对AI训练没意义。
比如颜值博主的评论区什么“好美”“好漂亮”的夸赞。
对于AI训练来说,意义不大。
经过筛选处理过后,能用的数据少得可怜。
陈腾又想到了GPT。
实际上第一代的GPT是在2018年推出的。
但是第一代的GPT在市场上,并没有搅动什么风云。
因为智能水平太低了,根本没有人乐意与这样的AI对话。
直到四年之后,足足喂了四年的数据,这才有了许多人愿意对话聊天的GPT。
诗经中的故事 龙族:从偷家夏弥开始 一把废铁双刀,怎么可以这么强 卡盒抽卡,不靠概率 锤震八荒 零基础快速入门的弈修象棋 俗人回档放弃清北为了女友上二本 军少的小娇软在七零赢麻了 神医狂妃,废柴三小姐 年代:随身农场被曝光了 hp:好一朵美丽的茉莉花 木河剑帝 家人们谁懂啊,职业太多也是罪 黑科技:谁让他这么造手机的 无缘高考,边境杀成人族战神! 鸿钧道祖,创世归来 综影视之末世神棍和她的忠犬男友 四合院:猎人开局,枪指贾张氏! 无限复制词条,重生女帝破大防 拒嫁豪门,首富小叔哄着我结婚
别人做上门女婿是去当牛做马,江小白却是去做大爷的,与丈母娘斗其乐无穷,与老婆斗其乐无穷,且看江小白如何脚踩婆家,拳打强敌,恣意纵横畅快人生如果您喜欢虎婿,别忘记分享给朋友...
二流大学毕业的黄峰,无奈做了保安,却意外获得了一个超级收纳箱,先进科技?法宝丹药?长寿仙丹我的,我的,都是我的!...
关于弃子归来三年,待他重回巅峰,王者归来,只为用心守护老婆孩子,当我再次牵起你的手时,天下再无一人敢伤你分毫。...
关于倾世狂妃皇上,深入爱!李婉清自从进宫后,无时无刻不在想着怎么算计傅崇,拉他下位。新婚夜,宠妃耀武扬威,她机智应对当朝太师找上门来问责,她霸气反击太后偏袒侄女意欲定罪,她嚣张反问。傅崇...
李横!本书的猪脚!他有很多话想对孙策说!大哥,大乔那事,真不是我做的!那是山贼李横做的,可可我是小白领李横啊!你就相信我吧!大哥,我跟你说要想生活过得去,就得头上戴点绿。你,你就想开点吧!这事,其实也没那么严重,不是嘛?可是,李横知道孙策根本就不会听自己的废话。没办法了!要想活命,只能和他拼了如果您喜欢三国开局被孙策追杀,别忘记分享给朋友...
汉明,汉人的大明。每每思及泱泱华夏,数千万汉人,被鞑子奴役了三百多年。心中总有一股难以言语的失落愤慨遗憾!于是有一天,和尚做了个梦主角吴峥于1645年八月十六日,魂穿在嘉定总兵吴之番侄子吴争身上,目睹了嘉定城人间地狱般的凄惨悲凉,从此走上波澜壮阔的反清复明之路。如果您喜欢汉明,别忘记分享给朋友...