百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

沈向洋,发了一个可以识别万物的大模型

ztj100 2025-01-08 18:46 17 浏览 0 评论

作者 | 邓咏仪

编辑 | 苏建勋

“讲卡伤感情,没卡没感情。”

2024年的IDEA大会上,IDEA创院理事长、美国国家工程院外籍院士沈向洋,抛出了一句格外现实又幽默的话。

另一方面,这也展现了他对未来AI时代一种鲜明的乐观情绪。

大模型的发展已经不如ChatGPT发布后那样,经历陡峭增长。进入到人类探索AGI(通用人工智能)的第二年,大语言模型的迭代已经放缓。相应地,AI应用、落地,占据了全球话题的中心。

但沈向洋觉得,虽然GPT-5尚未见身影,但算力的增长还是呈乐观趋势——根据EPOCH AI数据统计,大模型对于算力的需求,每年都是呈现四倍多的增长。

按这样的增长速度,以往按18个月算力涨一倍的摩尔定律也不再奏效。沈向洋重点解释了黄仁勋的“黄氏定律”,以模型训练来衡量算力的增长。若恒定按照一年涨四倍的算力速度增长,十年或许会预见100万倍的算力需求增长。不过这一定律,仍需要时间来检验。

“大模型要往前走,不单是参数扩大、模型规模大了之后,对训练的要求变高了,数据量也要增长。某种意义上来讲,对算力的需求呈跟参数的平方关系,这就是不得了的算力需求。”他说。

沈向洋 来源:作者拍摄

“过去这几年大家都讲‘人工智能三件套’,实际上都绕不开‘算力、算法、数据’这三件事情。”在这次大会上,沈向洋穿针引线,花了3个小时围绕“算法、算力、数据”这三个方向,来介绍IDEA的全新进展。

视觉模型仍是IDEA的研究重点——IDEA正式发布的最新通用视觉大模型DINO-X,可以拥有真正的物体级别理解能力。

这意味着,不像普通的视觉模型有训练数据的限制,DINO-X可以实现开放世界(Open-world)实现目标检测——无需用户提示,直接就可以检测所有物体,包括罕见的长尾物体(出现频率低但种类繁多的物体)。

这也会大大拓展模型的落地场景。

比如,“具身智能”是2024年火了一整年的AI行业话题。对于视障人士服务、服务类机器人等高难度场景,以往非常依赖大量的高质量数据标注,耗费巨量人力。但在DINO-X的帮助下,视觉模型以帮助标注公司快速完成大批量的高质量图像标注或者为标注员提供自动化的辅助结果,从而降低手工标注的工作量。

来源:IDEA

对传统的视觉模型应用广泛的场景,DINO-X也在自动驾驶、智能安防、工业检测等领域,会成为一个有力的补充,系统能够应对各种复杂场景,识别出传统模型难以检测的物体。

IDEA团队还推出行业平台架构,通过一个大模型基座,结合通用识别技术结合,让模型不需重新训练,就可边用边学,支撑多种多样的B端应用需求。

“用一个模型解决一百万个问题”,是这次模型发布的关键理念。

有别于主流的“全图理解”的方法,IDEA通过在物体级别的理解上加入语言模块,来优化大模型的幻觉问题。结合自研的“视觉提示优化”方法后,无需更改模型结构,不用重新训练模型,也可以实现小样本下的场景化定制。

来源:IDEA研究院

不过,随着模型体量不断变大,高质量数据已经成为桎梏。“现在人工智能的发展,已经耗尽了人类社会的所有高质量数据。”沈向洋表示。

合成数据随之而生。IDEA团队此次也发布了自研的语境图谱技术,解决过往文本数据合成方案的多样性匮乏等问题。该技术相当于是合成数据引入“指导手册”,以图谱为纲,指导用于合成的语境采样。

从实验结果显示,IDEA团队的方案能持续为大模型带来能力提升,表现超过目前的最佳实践(SOTA);从token消耗来看,平均节约成本85.7%。目前,该技术内测平台已开放,通过API提供服务。

在2024年,IDEA在AI应用落地层面明显提速。相较去年的科研论文阅读平台,今年IDEA公布了更多垂直领域的应用探索。

在预测方面,IDEA研发了多个化学领域专家大模型,在分子属性预测和化学反应预测能力上,都可以达到业界领先水平。

AI模型也可以应用在科研数据上,加快科研数据的处理速度。IDEA新发布的化学文献多模态大模型,就联合晶泰科技发布专利数据挖掘平台PatSight。这一模型将药物领域的专利化合物数据挖掘时间,从数周缩短至1小时。

而今年的一大热门方向——AI编程,正是因为模型智力水平不断提升,而成为下一个热门的应用方向。IDEA研究院的MoonBit团队,就展示了其开发平台的编程模块MoonBit。这个云原生AI编程工具,已具备完备的多后端支持和跨平台能力,可在硬件上直接运行,支持RISC-V架构,并将于12月正式开放。

模型也从软件层面走到硬件层面,更多在现实世界产生效用。

坐落在大湾区IDEA,有着得天独厚的硬件产业基础和优势。这次会议上,IDEA也一连宣布三个合作:与腾讯合作,在深圳福田区、河套深港科技创新合作区落地建设福田实验室,聚焦人居环境具身智能技术;与美团合作,探索无人机视觉智能技术;与比亚迪合作,拓展工业化机器人智能应用。

“低空经济”则是另一个IDEA强调的领域。IDEA不仅发布了《低空经济发展白皮书3.0》,还发起共建OpenSILAS创新联合体,与17家首批发起单位携手,预期打造一个开放共享、技术领先、不断迭代的系统和平台。

2024年,已经是IDEA大会的第四届大会。在这四年中,AI不仅从以CV(视觉识别)为主的1.0时代,跨越到以生成式AI为主的2.0时代,更是带来了AI治理等下一个时代的重要命题。如今的人类社会也许需要更多思考:我们与AI该如何更好地共存?

“AI的发展,能不能从经济最大的增长,转化到人类的最大福祉?这是在座的,在IDEA研究院从事技术研发的同事,以及产业落地的同事,在人工智能发展的道路上必须要去思考的问题。”沈向洋说。

欢迎关注

相关推荐

其实TensorFlow真的很水无非就这30篇熬夜练

好的!以下是TensorFlow需要掌握的核心内容,用列表形式呈现,简洁清晰(含表情符号,<300字):1.基础概念与环境TensorFlow架构(计算图、会话->EagerE...

交叉验证和超参数调整:如何优化你的机器学习模型

准确预测Fitbit的睡眠得分在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它们的性能。在...

机器学习交叉验证全指南:原理、类型与实战技巧

机器学习模型常常需要大量数据,但它们如何与实时新数据协同工作也同样关键。交叉验证是一种通过将数据集分成若干部分、在部分数据上训练模型、在其余数据上测试模型的方法,用来检验模型的表现。这有助于发现过拟合...

深度学习中的类别激活热图可视化

作者:ValentinaAlto编译:ronghuaiyang导读使用Keras实现图像分类中的激活热图的可视化,帮助更有针对性...

超强,必会的机器学习评估指标

大侠幸会,在下全网同名[算法金]0基础转AI上岸,多个算法赛Top[日更万日,让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。选择正确的验证指...

机器学习入门教程-第六课:监督学习与非监督学习

1.回顾与引入上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。2.监督学习监督学习就像是有老师的教学...

Python教程(三十八):机器学习基础

...

Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置

你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...

超全面讲透一个算法模型,高斯核!!

...

神经网络与传统统计方法的简单对比

传统的统计方法如...

AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程

...

自回归滞后模型进行多变量时间序列预测

下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。假设要预测其中一个变量。比如,sparklingwine。如何建立一个模型来进行预测呢?一种常见的方...

苹果AI策略:慢哲学——科技行业的“长期主义”试金石

苹果AI策略的深度原创分析,结合技术伦理、商业逻辑与行业博弈,揭示其“慢哲学”背后的战略智慧:一、反常之举:AI狂潮中的“逆行者”当科技巨头深陷AI军备竞赛,苹果的克制显得格格不入:功能延期:App...

时间序列预测全攻略,6大模型代码实操

如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,欢迎移步宝藏公众号...

AI 基础知识从 0.4 到 0.5—— 计算机视觉之光 CNN

...

取消回复欢迎 发表评论: