九游会·J9

蚂蚁集团百灵大模型最新进展：已具备原生多模态能力

2024-07-05 14:18 来源：证券日报网

本报讯（记者李冰）7月5日，在2024世界人工智能大会“可信大模型助力产业创新发展”论坛上，蚂蚁集团公布了其自研的百灵大模型最新研发进展：百灵大模型已具备能“看”会“听”、能“说”会“画”的原生多模态能力，可以直接理解并训练音频、视频、图、文等多模态数据。原生多模态被认为是通往AGI的必经之路，在国内，目前只有为数不多的大模型厂商实现了这一能力。

记者从大会现场的演示看到，多模态技术可以让大模型更像人一样感知和互动。据悉，目前百灵的多模态能力已应用于“支付宝智能助理”上，未来还将支持支付宝上更多智能体升级。

发布现场，蚂蚁集团副总裁徐鹏展示了新升级的多模态技术可实现的更多应用场景：通过视频对话的自然形式，AI助理能为用户识别穿着打扮，给出约会的搭配建议；根据用户不同的意图，从一堆食材中搭配出不同的菜谱组合；根据用户描述的身体症状，从一批药物中，挑选出可能合适的药，并读出服用指导，供用户参考等。

同时，基于百灵大模型多模态能力，由蚂蚁集团与武汉大学联合研发的遥感模型SkySense，也在论坛上公布了开源计划。SkySense是目前参数规模最大、覆盖任务最全、识别精度最高的多模态遥感基础模型。

“从单一的文本语义理解，到多模态能力，是人工智能技术的关键迭代，而多模态技术催生的‘看听说写画’的应用场景，将让AI的表现更真实，更接近人类，从而也能更好地服务人类。蚂蚁会持续投入原生多模态技术的研发。”徐鹏说。

（编辑张伟）

九游会·J9 - 中国官方网站 | 真人游戏第一品牌

热点新闻

多重利好因素共舞提升中国资产吸引力

美联储降息“靴子落地” 中美利差有望进一步收窄

券商秋季策略会传递出哪些信息？

最新社融数据释放了哪些积极信号？

24小时排行一周排行

深度策划

聚焦2024数博会

数博会期间，国家数据局会同科技部等部门发布……[详情]

市场快讯

21:40	奇精机械泰国新工厂开业庆典举行
21:38	车车科技与北汽集团系保险经纪公司...
21:38	华贵保险金融教育宣传活动成效显著
21:38	校企融合赋能公立医院高质量发展 ...
21:38	首批三只中证A500ETF募集结束
21:32	国务院国资委：优化上市公司董事会...
21:30	霸王茶姬携手中国网球公开赛共同...
21:30	险企如何照护认知症患者？记者实...
21:26	宁波港拟以65亿元投建宁波舟山港六...
21:26	锅圈欢欢食品项目投产锅圈食品产...
21:22	9月21日上市公司重要公告集锦：贵...
21:16	阿里云无影AI云电脑亮相综合体验...

互联网新闻信息服务许可证 10120180014增值电信业务经营许可证B2-20181903

京公网安备 11010202007567号京ICP备17054264号

证券日报网所载文章、数据仅供参考，使用前务请仔细阅读法律申明，风险自负。

证券日报社电话：010-83251700网站电话：010-83251800

网站传真：010-83251801电子邮件：xmtzx@zqrb.net