🎵 M2UGen融合音乐理解和多模态任务,支持文字、图像、视频生成音乐。
🎥 Midjourney计划推出“文本转视频”模型,扩展AI形象生成器到视频创作领域。
通过GPT-4和DELL-3的结合,使用ChatGPT模拟庞贝古城火山爆发时的历史情景,并展示了多模态人工智能的强大功能。
在2024年,我们将看到具有高分辨率和长期连贯性的视频生成。这将需要更多的“思考” ,即系统2的推理和长远规划。
据了解,Zara的这场直播一改传统直播间的紧凑,而是将整个秀场搬到了直播间,用户不仅可以看到Zara以T台走秀的形式演绎讲解多款Zara秋冬新品,还可以看到模特更换妆造、摄影师跟拍这些镜头外的场景,沉浸感拉满。