,微软近日发布新闻稿,推出了名为可组合扩散模型,这是一种独特的、基于可组合扩散的人工智能模型,其设计目标是互动和生成多模态内容。
微软设计 codi 的目标,旨在解决传统单一模态 ai 模型的局限性。以同步视频和音频为例,独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。
codi 采用了独特的可组合生成策略,在扩散过程中对齐多模态,从而生成相互交织的模式,更重要的是,codi 能够处理任意输入模式并生成任意模态的内容。
codi 由 microsoft azure 认知服务研究团队与北卡罗来纳大学教堂山分校合作开发,也是 microsoft 项目 i-code 的一部分,该项目使用人工智能来增强人机交互。
it之家在此附上 codi 项目官方介绍链接,感兴趣的用户可以深入阅读。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,it之家所有文章均包含本声明。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。