sora加速多模态进程专题

其中有16款是多模态模型，又分属图像理解、视频理解、图像生成、视频生成、图像编辑、音乐生成、多模态推理等方向。区别于行业更常见的图像模型、音频模型、视频模型等不加区分的定义和命名方式，阶跃星辰格外强调多模态模型...

2025-06-02

针对不同模态数据在结构、规模、知识密度上的差异，通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术，大幅提升跨模态学习效率和多模态融合效果，学习效率提高近2...

2025-06-02

去年，百度CEO李彦宏多次公开表示，Sora这种视频生成模型无论多火爆，百度都不去做。他给出的理由是，多模态模型尤其是视频生成领域，幻觉问题尚未解决，这限制了大规模应用。但字节跳动和阿里巴巴却没有因为幻觉问题停止布局...

2025-06-02