Vimi视频生成模型-首个面向C端用户的可控人物视频生成大模型

世界人工智能大会"镇馆之宝"——Vimi 视频生成模型，开发内测啦！！

大家好，今天为分享一款正在内测的 AI 视频制作模型：Vimi

就在2024年7月4日，在上海举行的世界人工智能大会（WAIC2024）上，商汤科技推出的Vimi模型荣获"镇馆之宝"荣誉。至此，Vimi，就成了一个焦点。

内测申请链接在文末，朋友们可以去填写表单，也可以去关注vimi公众号加入内测群，内测通过就可以进入vimi小程序使用beta版。

一、Vimi相机简介

Vimi相机，是全球首个稳定的可控人物视频生成产品，基于商汤科技强大的日日新大模型能力，通过动作视频、动画、声音和文字等多种驱动元素，实现了人物类图片到视频的生成。

早在 Sora 的 demo 发布之前，他们就开始立项，进行可控人物 AI 视频模型的研发。重点发力「人物」、「可控」两个难点。

Vimi不仅在可控性上表现出色，更在人物稳定性和视频时长上取得了显著的突破，能够生成长达一分钟的单镜头人物视频，且画面效果稳定，不随时间劣化或失真。

与传统的图片表情控制技术相比，Vimi能够控制人物的面部表情和肢体动作，同时生成逼真的头发、服饰和背景，并支持光影变化，为用户带来稳定而高质量的视频生成体验。

这款主打女性用户趣味视频体验和专属AI视频写真的产品，以其创新的技术优势和卓越的用户体验，正在引领AI视频生成领域的新潮流。

二、Vimi优势

1.稳定生成 1 分钟的单镜头人物类视频

2.完全面向 C 端用户开放使用

3.在半身区域内控制照片中人物的自然肢体变化

可控生成高一致性的人物表情及肢体动作视频 ：Vimi的核心技术在于其能够精确控制视频中人物的表情和肢体动作，生成与目标动作高度一致的视频内容。无论是微妙的面部表情变化，还是复杂的全身动作，Vimi都能够准确捕捉并再现。

多种控制方式 ：Vimi提供了多样化的控制输入方式，包括人物视频、动画参数、语音文字等。这种灵活性使用户能够通过不同的输入方法来驱动视频生成，从而创造出更加丰富和多样化的视频内容。无论是通过预设的动画模板调整参数，还是通过语音指令快速生成视频，Vimi都能够提供强大的支持。

分钟级单镜头 ：Vimi不仅支持生成长达一分钟的单镜头人物视频，而且Vimi具备极强的稳定性，尤其在长视频的情景下，能够稳定保持人物的脸部可控，可生成长达1分钟以上的单镜头人物类视频，画面效果不会随着时间的变化而劣化或失真。

生成合理的视频场景： Vimi不仅关注人物本身的表现，还能够生成合理的视频场景，包括人物的头发、服饰、背景等元素的补全，以及光影变化的支持。这意味着Vimi生成的视频不仅人物表现自然，整个场景也和谐统一，为观众提供了更加真实和沉浸式的观看体验。

三、Vimi应用场景

可快速生成个性动态表情包：用Vimi可以快速捕捉和生成具有个人特色的动态表情。无论是想要展现个人情感的细微变化，还是创造独特的幽默元素，Vimi都能够满足需求。

可快速生成唯美写真视频 ：Vimi可以自定义背景、服饰、发型等元素，甚至可以调整光影效果。Vimi的算法能够确保视频中的人物形象自然、和谐，同时保持高分辨率和色彩的丰富性，使得最终生成的写真视频既具有艺术性，也具有观赏性，适合用于个人收藏、社交媒体分享或商业展示。

链接：

vimi官网：https://vimi.sensetime.com/

内测链接：https://vme-int.softsugar.com/questionnaire/

vimi相机小程序：小程序://Vimi相机/oWepnVacIQRivNH（复制发送到任意微信聊天消息）