标签:VQGAN图像编码器

微软推出基于Transformer架构和VQGAN图像编码器的游戏开发大模型:实现离散化处理与多样性测试,一张图片生成游戏的创新时代来临,游戏界ChatGPT正式登场

微软发布游戏领域创新大模型Muse,大幅提升开发效率 微软在官网上推出了专为游戏领域设计的创新大模型——Muse。尽管Muse基于著名的Transformer架构,但其创建游戏场景的方式却独具特色,不依赖传统的文本提示,而是通过游戏画面和控制器操作的序列化数据作为输入,生成符合游戏机制和物理规则的。例如,仅凭一张游戏截图,Muse就能迅速生成多个可能的后续游戏画面,并通过Xbox手柄控制角色,生成与开发者操作相匹配的后续,极大地提高了游戏开发效率。 游戏开发流程复杂,Muse简化了各个环节 游戏开发是一个高度复杂的过...