东南肥肥 作品

第904章 关键在于算法

午后的阳光慵懒地洒在晚霞山庄操盘大厅的休息区。

落地窗外的景色被镀上了一层金黄。

休息区内,静谧中透着几分闲适。

叶回舟、信息部的杨闲以及小胖子王涛围坐在一张木质圆桌旁。

桌上,三杯咖啡正冒着袅袅热气。

咖啡的香气在空气中弥漫开来,为这略显严肃的氛围添了几分温馨。

杨闲刚看完马斯克g3的发布会,此刻满脸失望。

他轻轻将手中的平板电脑放在桌上,率先打破了沉默。

“今天看了马斯克g3的发布会,实在是太让人失望了。

这号称地表最强的ai大模型,依我看,完全是在走弯路。”

叶回舟正端起咖啡杯,轻抿一口。

听到杨闲的话,眼中闪过一丝好奇。

他放下杯子,问道:“怎么个走弯路法?我还没仔细了解呢,你给详细说说。”

杨闲轻叹一口气,身子微微前倾,缓缓说道:“你瞧,g3发布会给出的数据看似耀眼得很。

在数学科学和编程的基准测试上,确实超越了不少主流模型。

像gpt4o、cloud3.5、deptv3这些,在它面前都得甘拜下风。

而且在推理能力方面,g3.ingta和g3min reasoning的跑分也超过了同等级的其他模型。

比如说deeptr1还有openai的o3mini。”

小胖子王涛正百无聊赖地转着手中的铅笔,听到这儿,不禁皱起眉头,满脸疑惑。

“听起来很厉害呀,那还有什么可失望的?”

杨闲无奈地摇了摇头,用手指轻轻敲着桌面,解释道:“问题就藏在这些看似厉害的数据背后。

你看,数据差距其实很小,gpt4o差不多1400分,g3也就1400分左右。

只差20多分,也就1%多一点的差距。

deepr1是1360分,和g3的差距也就2%左右。

这种微小差距可能只是跑分的小误差,或者仅仅是记忆能力的体现。

况且,为了这点差距,它训练用了10万克的英伟达h100的gpu。

累计训电时长达2亿gpu小时,就为了这微不足道的差距,付出如此巨大的代价,简直是资源的极大浪费。”

叶回舟听着,陷入了思考。

他轻轻转动着咖啡杯,缓缓说道:“确实,如此庞大的算力投入,感觉有点得不偿失。

但你觉得这就能说明马斯克方向错了吗?”

杨闲推了推眼镜,身子往后靠了靠,接着说:“我觉得可能性很大。

他过度依赖跑分,要知道跑分这东西是可以作弊来营造优势的。

很多模型看着跑分很高,但实际使用起来却不尽人意,就像之前的glock2。

g3耗费这么多资源,才比其他模型多那么一点分数,就好比用大量资源去换取微不足道的优势。

再看看人类大脑,人脑功率10到30瓦,却能展现出强大的能力,关键就在于算法。

像李菲菲团队用50美金复现deep seek,就证明了一个模型强大与否,核心在于思考和推理能力,而非规模。”

小胖子王涛若有所思,停下手中转动的铅笔,摸着下巴说:“我明白你的意思了。

这就好比我们学习知识,要是只靠死记硬背,考试能应付,但实际应用就不行。

ai要是只依赖大量记忆数据,没有真正的推理和思考能力,也算不上真正的智能。”

叶回舟点头表示认同。

他拿起勺子,轻轻搅拌着咖啡,说道:“没错,所以像deep使用的moe混合专家模式,就很类似大脑节能的方法。

而且gpt系列模型,从gpt3到gpt4,参数不断增大。

可从人类发展角度看,人脑并没有因参数显著增大而变得更聪明。”

杨闲又补充道:“再看ai发展的总体趋势,现在的ai就像温水里的青蛙。

就拿欧洲来说,德国和法国这样的强国,各有心思。

德国是经济强国,法国是军事强国,可即便组合起来,也未必能称霸欧洲。

面对美国政策,欧洲反应混乱,美国态度的变化,才让欧洲看清美国本质。”

小胖子王涛一脸好奇,眼睛睁得大大的:“欧洲现在的情况和ai有什么联系呢?”

叶回舟耐心地解释道:“在科技发展方面,欧洲也存在类似问题。

欧洲很多国家盲目追随美国政策,比如在经济领域对一些国家加关税,毫无自己的主见。

在ai发展上,欧洲没有形成强大统一的发展战略,还不断消耗资源追随美国行动。

这就如同ai走入歧途。

我们必须思考,如何在科技

发展中找准自己的方向,避免盲目跟风或过度追求表面数据。”

杨闲点头称是。

他端起咖啡,却没喝,只是看着杯中的液体说道:“是的。

在ai发展上,我们应回归本质,像人类大脑一样重视算法和真正的智能产生机制。

而非单纯追求高参数、大量数据和巨额算力投入。”

说着,杨闲的手机突然震动了一下。

他低头看了看,扶了扶眼镜,看着手机群说道:“有朋友留言说,清华大学那边有进展。

国内有团队正在做福建运算相关的通用平台研究。

视频发布不到十几个小时,就有人爆料青北大学相关团队公布了相关论文。

利用福建运算逻辑,通过显卡底层增强,让4090这种消费级显卡能完全运行r一满血大模型。

而且速度不比专业的a100算卡慢。

很多朋友问这是怎么回事,原理其实很简单。

显卡原本是提升显示效果的,通过gpu提供格栅化运算和浮点运算来实现成像。

以前超级计算用计算机、服务器、大型机甚至巨型机。

但到了ai大模型时代,人们发现gpu计算速度最快,不过它并非最适合。

于是英伟达推出了cuda平台,可理解为在显卡上进行计算的操作系统。

必须在这个平台上才能调用显卡算力,实现数据进入大模型训练等工作。

但它的工作原理也是调用底层芯片的浮点运算能力。

有没有更好的办法呢?当然有。

清华大学的论文解析了整个4090芯片底层,通过二进制语言编写运算代码,支持在上面部署大模型,提升了推理能力。

但要说这块卡真正的训练能力和a100相比,肯定比不上,毕竟算力有很大差距。

不过这个逻辑是可行的,放在任何显卡上,通过底层充分发挥浮点运算能力。

就能超越cuda平台对单个显卡性能的损失。

因为cuda是通用平台,配置在英伟达的显卡和算卡技术之上。

不可避免会对单个显卡性能有一定损失,其插件也是通用的,保证能用但效率不高。

记得22年还是23年,美国有个团队专门发文分析,cuda对英伟达算卡的利用率不到85%,大概82点几。

所以,如果把浮点运算提升到很高水平,超越cuda平台下英伟达算卡的表现没问题。

这是丁s开源论文里的重要问题,也是国内很多团队在这方面下功夫的原因。

通过机械语言直接调用底层浮点算力,适配多个国产卡,形成通用键,挖掘算力内部潜力。

这算是一个非常重要的进步,也是各个团队正在努力的方向,他们的成果非常了不起,是众多工程师共同努力的结果。”

叶回舟思考片刻后,微微皱眉说道:“可这对现在的ai研究界来说,可能是个巨大挑战。

毕竟目前大家都在朝着提高参数和扩大规模的方向发展。”

杨闲笑了笑,靠在椅背上,回应道:“没错,这就需要有人站出来打破常规。

就像马斯克在其他领域创新一样,如果他在ai领域也能实现突破,那才值得期待。

但现在他的g3给我的感觉,还是在旧框架里玩新花样。”

小胖子王涛拍了拍杨闲的肩膀,脸上露出灿烂的笑容:“不管怎样,能有这样深入的讨论已经很棒了。

希望未来能有更多关于ai正确发展方向的思考。”

叶回舟拍了拍王涛的手,点头说道:“没错,现在技术发展日新月异。

我们必须不断思考,才不会迷失在这些看似华丽的数据背后。”

杨闲接着说:“我们公司其实也能从中吸取经验。

在项目开发中,不能只看重表面的成果数字。

更要注重质量、效率和可持续性,打造真正有能力的智能系统。

而不是靠堆砌资源弄出华而不实的东西。”

叶回舟表示赞同。

他双手交叉放在胸前,说道:“而且我们得思考,在现有技术环境下,找到属于我们的创新点。

是像马斯克尝试突破的大规模数据处理,还是在算法优化或者应用场景创新上发力?这都需要我们好好琢磨。”

小胖子王涛兴奋地拍了下桌子,说道:“我觉得可以从应用场景创新入手。

比如将ai与我们现在的工作流程深度融合,切实提高工作效率。

而不是追求像g3那种靠数据说话的东西。”

杨闲眼睛一亮,坐直了身子,说道:“这个想法不错。

我们现在工作环节众多,可以通过ai优化。

比如数据分析环节,若按g3那种大量数据记忆的方式,效率可能不高。

但要是能让ai像人类一样

思考分析,就会更智能。”

叶回舟补充道:“而且我们还要考虑ai的可解释性。

现在很多大模型虽能给出结果,却难以解释原因。

这就好比学生考试能拿高分,老师却不知道解题思路,不是好的发展状态。”

杨闲叹了口气,无奈地摇了摇头,说道:“是啊,这是目前ai发展面临的一大难题。

我们不能只满足于ai给出正确答案,更要让它明白为什么是这个答案。”

小胖子王涛皱着眉头,面露难色:“这似乎有点难,人类思维模式复杂。

让ai完全理解并解释,谈何容易。”

叶回舟思考片刻后,目光坚定地说:“确实有难度,但我们可以从基础做起。

比如针对我们公司的数据,先让ai明白规则,逐步构建其理解能力。

就像教小孩做数学题一样。”

杨闲点头表示赞同。

他眼神中透着一丝期待:“对,我们可以从简单的数据和场景入手,慢慢培养ai的这种能力。

人类学习是循序渐进的过程,ai发展也不应急于求成。”

叶回舟突然眼睛一亮,像是想到了什么,说道:“说到教学,我们还可以思考如何让ai更好地教育人。

根据不同学习能力、思维方式定制教育内容。

而不是像现在一些教育软件那样机械传授知识。”

杨闲眼中闪烁着光芒,兴奋地说道:“这个方向很棒。

我们可以先做市场调研,了解不同用户学习过程中的痛点。

再让ai针对性解决这些问题。”

小胖子王涛打趣道:“哈哈,听起来我们像是要掀起一场教育科技革命了。”

杨闲笑着说:“虽然没那么夸张,但如果能在这个方向上取得一些成绩,也很不错。”

叶回舟说道:“那我们得尽快整理想法,做个初步方案。”

杨闲看着叶回舟和小胖子王涛,坚定地说:“好啊,那我们信息部今天就开始准备。

希望我们能在这条路上有所收获!”

说罢,他的眼神又看向了大屏幕黄金的走势。

老关等着保温杯走了过来,看着黄金的k线图,说道:

“黄金价格最近的上涨,还有一个解释就是挤兑。“

旁边的小胖子问道,“黄金还有挤兑啊?”

老关笑着点点头解释:

“投资者在美国或者国内的交易所交易的黄金期货呢都是所谓的纸黄金。

现在最新的数据是一盎司黄金的实物黄金对应133一盎司的纸黄金。

用大家熟悉的场景,这就相当于一个银行的存款准备金率呢只有千分之7.5%。一旦有超过千分之7.5的存款,同时要求取钱的话。

那这家银行不就被挤兑了!

而对黄金的挤兑,也就是这么发生的。

首先,黄金价格持续的上涨,这一走势呢吸引了更多的动量交易员和对冲基金来购买纸黄金,于是推高了期货的价格呢不断的高于现货的价格。

通常情况下,做交易商的银行,也就是经营交易的这个银行会持有于多头期货头寸,相反的空头头存。

也就是说,他们持有空头头存,并且在期货合约到期的时候呢,必须交割实物黄金。

一般说来,由于合约吧,黄金的合约通常会进行展期,所以说不会出现问题的。”