视界一粟Yisu – 中国首个超时长sora级视频生成大模型

视界一粟 YiSu是由北京极佳视界科技有限公司联合清华大学自动化系研发的视频生成大模型。这个模型可以生成超过1分钟的视频，并且具有超大运动、超强表现力等优势。此外，YiSu模型的成本更低、速度更快，适用于大规模产品应用。此外，视界一粟Yisu不仅仅是一个视频生成模型，它还是向世界模型迈进的重要一步。世界模型对于自动驾驶通用机器人等物理世界的通用智能至关重要，在数据生成、闭环仿真、端到端方案等方面都拥有关键的作用。视界一粟YiSu展示了基于视频生成的同款架构，用于自动驾驶和机器人场景世界模型的效果。

官网入口：https://world-dreamer.github.io/

视界一粟Yisu – 中国首个超时长sora级视频生成大模型插图

主要功能特点：

多模态融合能力:Yisu模型不仅限于处理单一的文本或图像数据，它还具备多模态融合的能力。这意味着模型能够同时理解和生成包含文本、图像、音频等多种信息的视频内容。这种多模态融合的能力使得Yisu模型在视频生成领域具有更广泛的适用性。
高效训练与推理:通过优化算法和架构，Yisu模型在训练和推理速度上均实现了显著提升。这使得模型能够更快速地生成视频内容，提高了视频生成的效率。同时，高效的训练过程也使得Yisu模型能够更快地适应新的数据和场景。
端侧运行能力:Yisu模型具备在终端设备上直接运行的能力，无需依赖云端支持。这使得用户可以在本地设备上快速生成视频内容，无需等待云端处理时间，提高了视频生成的便捷性和灵活性。
高性价比:相较于其他视频生成解决方案，Yisu模型在成本上更低，速度更快，具有极高的性价比。这使得Yisu模型更加适用于各种应用场景，尤其是那些对成本敏感或需要快速生成视频内容的场景。
持续迭代与优化:视界一粟Yisu团队致力于模型的持续迭代与优化。他们计划按照每周一个小版本、每月一个大版本的迭代速度进行快速成长和进化。未来，Yisu模型将在视频时长、可控性、推理速度、运行成本以及理解物理世界等方面实现大幅度提升，为用户提供更加优质的视频生成服务。
超长时长：Yisu原生支持16秒的视频生成，并具备扩展至1分钟以上的能力，打破了传统视频生成模型在时长上的限制。
高性能表现：模型具备超大运动范围、超强表现力，并能够理解物理世界的规律，使得生成的视频更加逼真、自然，充满动感。