专题分类 专题首页 切换频道
最新专题资讯
对话阶跃星辰姜大昕:Sora技术有局限,多模态理解生成一体化才是未来
其中有16款是多模态模型,又分属图像理解、视频理解、图像生成、视频生成、图像编辑、音乐生成、多模态推理等方向。区别于行业更常见的图像模型、音频模型、视频模型等不加区分的定义和命名方式,阶跃星辰格外强调多模态模型...

2025-06-02

坚持不做Sora,百度为何又开始重视多模态大模型?
针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2...

2025-06-02

坚持不做Sora,百度为何又开始重视多模态大模型?百度|文心_新浪新闻
去年,百度CEO李彦宏多次公开表示,Sora这种视频生成模型无论多火爆,百度都不去做。他给出的理由是,多模态模型尤其是视频生成领域,幻觉问题尚未解决,这限制了大规模应用。但字节跳动和阿里巴巴却没有因为幻觉问题停止布局...

2025-06-02

相关专题