免费

Vimi视频生成模型-首个面向C端用户的可控人物视频生成大模型

  • 2024年 7月 28日
  • 阅读数:2232

世界人工智能大会"镇馆之宝"——Vimi视频生成模型,开发内测啦!!

大家好,今天为分享一款正在内测的 AI 视频制作模型:Vimi

就在2024年7月4日,在上海举行的世界人工智能大会(WAIC2024)上,商汤科技推出的Vimi模型荣获"镇馆之宝"荣誉。至此,Vimi,就成了一个焦点。

内测申请链接在文末朋友们可以去填写表单,也可以去关注vimi公众号加入内测群,内测通过就可以进入vimi小程序使用beta版。

一、Vimi相机简介

Vimi相机,是全球首个稳定的可控人物视频生成产品,基于商汤科技强大的日日新大模型能力,通过动作视频、动画、声音和文字等多种驱动元素,实现了人物类图片到视频的生成。

早在 Sora 的 demo 发布之前,他们就开始立项,进行可控人物 AI 视频模型的研发。重点发力「人物」、「可控」两个难点。

Vimi不仅在可控性上表现出色,更在人物稳定性和视频时长上取得了显著的突破,能够生成长达一分钟的单镜头人物视频,且画面效果稳定,不随时间劣化或失真。

与传统的图片表情控制技术相比,Vimi能够控制人物的面部表情和肢体动作,同时生成逼真的头发、服饰和背景,并支持光影变化,为用户带来稳定而高质量的视频生成体验。

这款主打女性用户趣味视频体验和专属AI视频写真的产品,以其创新的技术优势和卓越的用户体验,正在引领AI视频生成领域的新潮流。

二、Vimi优势

1.稳定生成 1 分钟的单镜头人物类视频

2.完全面向 C 端用户开放使用

3.在半身区域内控制照片中人物的自然肢体变化

可控生成高一致性的人物表情及肢体动作视频 :Vimi的核心技术在于其能够精确控制视频中人物的表情和肢体动作,生成与目标动作高度一致的视频内容。无论是微妙的面部表情变化,还是复杂的全身动作,Vimi都能够准确捕捉并再现。

多种控制方式 :Vimi提供了多样化的控制输入方式,包括人物视频、动画参数、语音文字等。这种灵活性使用户能够通过不同的输入方法来驱动视频生成,从而创造出更加丰富和多样化的视频内容。无论是通过预设的动画模板调整参数,还是通过语音指令快速生成视频,Vimi都能够提供强大的支持。

分钟级单镜头 :Vimi不仅支持生成长达一分钟的单镜头人物视频,而且Vimi具备极强的稳定性,尤其在长视频的情景下,能够稳定保持人物的脸部可控,可生成长达1分钟以上的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真。

生成合理的视频场景: Vimi不仅关注人物本身的表现,还能够生成合理的视频场景,包括人物的头发、服饰、背景等元素的补全,以及光影变化的支持。这意味着Vimi生成的视频不仅人物表现自然,整个场景也和谐统一,为观众提供了更加真实和沉浸式的观看体验。

三、Vimi应用场景

可快速生成个性动态表情包:用Vimi可以快速捕捉和生成具有个人特色的动态表情。无论是想要展现个人情感的细微变化,还是创造独特的幽默元素,Vimi都能够满足需求。

可快速生成唯美写真视频 :Vimi可以自定义背景、服饰、发型等元素,甚至可以调整光影效果。Vimi的算法能够确保视频中的人物形象自然、和谐,同时保持高分辨率和色彩的丰富性,使得最终生成的写真视频既具有艺术性,也具有观赏性,适合用于个人收藏、社交媒体分享或商业展示。

链接:

vimi官网:https://vimi.sensetime.com/

内测链接:https://vme-int.softsugar.com/questionnaire/

vimi相机小程序:小程序://Vimi相机/oWepnVacIQRivNH(复制发送到任意微信聊天消息)