专题分类 专题首页 切换频道
最新专题资讯
Meta 发布 Multi-SpatialMLLM:多模态 AI 突破空间理解瓶颈_模型_任务_MultiSPA
多模态大语言模型(MLLMs)近年来在视觉任务处理上取得显著进展,但其作为独立数字实体的应用方式限制了实际影响力。随着机器人和自动驾驶等领域的需求增长,MLLMs 需要具备复杂空间理解能力。然而,现有模型在基础空间推理...

2025-06-09

多模态AI新基准发布,深度解析领先模型的技术革新与挑战
2025年,来自UC伯克利、香港大学、纽约大学、加州大学戴维斯分校等多所知名高校及研究机构携手推出的All-AnglesBench基准测试,标志着多模态AI技术迎来了关键性突破。这一新基准旨在通过真实场景中的多视角问答对,深入衡量多...

2025-06-09

天风证券:科技政策组合拳密集发力 大模型向多模态演进
产业趋势:大模型向多模态发展,核聚变多项目现新进展。市场回顾:指数窄幅震荡,医药及新消费相关概念表现强势。5月A股市场整体呈现窄幅震荡格局。Wind全A指数波动区间收窄,全月平均成交额约1.2万亿元,与上月基本持平。

2025-06-09

产业赛道与主题投资风向标:科技政策组合拳密集发力 大模型向多模态演进
产业趋势:大模型向多模态发展,核聚变多项目现新进展。(1)人工智能:字节迭代多模态大模型,媲美谷歌新品;阿里开源全功能视频大模型,单一模型全面支持...谷歌举行年度I/O开发者大会,推出AI智能体、在线会议同声传译等功能;...

2025-06-09

香港中文大学研究团队用3D视觉几何先验增强多模态大语言模型
2025年5月,香港中文大学 的郑铎、黄世佳、李岩洋和王立威发表了一项创新研究,题为《从视频中学习3D世界:用3D视觉几何先验增强多模态大语言模型》(Learning from Videos for 3D World:Enhancing MLLMs with 3D Vision ...

2025-06-09

SeePhys多模态基准揭示AI物理理解的技术突破与挑战_模型_科学_逻辑
近期,由中山大学、苏黎世联邦理工学院、华为诺亚方舟实验室及香港大学联合研发的全新多模态物理推理基准—SeePhys,成为行业关注的焦点。该基准旨在系统性评估AI在理解复杂物理图像与理论推导中的能力,彰显了AI在科学认知...

2025-06-09

相关专题