
摘要:Dreamina 是字节跳动剪映团队面向海外用户推出的一站式 AI 创作平台,以 Seedance 视频生成架构和 Seedream 图像模型为核心,提供文生图、图生图、文生视频、图生视频、智能画布、故事创作模式、数字人与对口型等功能,支持多模态输入与多语言提示词,面向自媒体博主、电商卖家、跨境创作者与专业设计师,提供按代币计费的会员体系与多平台客户端。
Dreamina官网入口:https://dreamina.capcut.com
一、平台定位与品牌背景
Dreamina AI 是字节跳动剪映团队开发的生成式 AI 创作平台,最早以 CapCut Dreamina 名称内测,2024 年 5 月正式启用中文名“即梦”,并同步推出海外版 Dreamina,面向北美、东南亚等海外市场以及跨境出海内容创作者。
- 即梦 / Dreamina 关系:Dreamina 为即梦的海外版品牌,共享自研模型与核心能力,界面语言、定价与部分功能针对海外市场优化。
- 一站式 AI 创作平台:集成图像生成、视频生成、智能编辑、创意社区与故事创作模式,覆盖“图像→文字设计→视频→编辑→灵感获取”的全链路创意需求。
- 目标用户:专业设计师、视频创作者、自媒体博主、电商卖家与跨境出海内容生产者。
二、核心功能模块
2.1 AI 图像生成
- 文生图(Text-to-Image):用户输入自然语言提示词,平台基于 Seedream 系列模型生成高质量图像,支持多语言提示词,英文提示词下排版与文字生成更稳定。
- 图生图(Image-to-Image):上传参考图后,通过风格迁移、背景替换、姿势保留等方式生成新图,适用于角色设计、产品换背景等场景。
- “再来一张”(Make a Similar One):复用社区作品的提示词与风格,在保留整体视觉特征的基础上微调生成,降低提示词门槛。
2.2 AI 视频生成
- 文生视频(Text-to-Video):输入文本描述直接生成短视频,支持镜头运动、节奏与风格控制。
- 图生视频(Image-to-Video):上传静态图作为首帧,平台自动生成动态视频,可添加运镜与转场。
- 首尾帧控制:上传首帧与尾帧图像,由模型生成中间过渡片段,用于精确控制视频起止状态。
- Seedance 2.0:支持文本、图像、视频片段、音频等多模态输入,实现 2K 分辨率、15 秒时长、24fps 帧率的视频生成,并具备多镜头叙事与音画同步能力。
2.3 智能画布与编辑工具
- 智能画布:在多层画布上完成 AI 生成、局部重绘、扩图、擦除与融合,实现多元素无缝拼接与风格统一。
- 局部重绘:选中区域重绘而不影响整体,用于修改人物服饰、产品细节或背景元素。
- 智能扩图:支持 1.5–3 倍画面扩展,补全背景与构图。
- 消除与抠图:一键去除背景或特定元素,方便制作商品白底图、人物头像等。
2.4 数字人与动作模仿
- OmniHuman 多模态数字人模型:输入单张人物照片 + 一段音频或视频,生成口型同步、动作自然的数字人视频。
- 动作模仿:上传人物图 + 参考动作视频,使人物复刻视频中的动作与表情,支持动漫/卡通风格。
- 大师模式(OmniHuman-1):根据照片 + 音频自动生成匹配肢体动作的视频,适用于演讲、唱歌、乐器演奏等场景。
2.5 AI 对口型与故事创作模式
- AI 对口型:为视频中人物配音并自动匹配口型,支持多种音色与用户自定义配音,最长 9 秒口型视频。
- 故事创作模式:在时间线上拖放图像/视频/音频素材,自动生成分镜与脚本,支持 10 张关键帧生成约 45 秒长视频。
三、技术架构与模型体系
3.1 Seedream 图像模型系列
- Seedream 5.0 Lite:最新图像生成模型,支持文生图与图生图,内置实时检索与逻辑推理能力,对中文提示词与多语言排版有优化。
- Seedream 5.0:定位为“最强大图像生成器”,支持画布编辑、风格预设与商业安全输出,适用于海报、品牌素材与产品设计。
- 图像模型 2.1 / 3.0 / 3.1:2.1 版主打“一句话生成海报”,突破中文文字生成难题;3.0/3.1 采用 MoE 混合专家架构,强化中文语义理解与专业风格表现。
3.2 Seedance 视频生成架构
- Seedance 1.0 / 1.5 Pro:早期视频生成模型,支持文生视频、图生视频与多语言配音,是 Dreamina 视频功能的基础版本。
- Seedance 2.0:最新多模态视频生成架构,可同时接收文本、图像、视频片段与音频输入,实现多镜头叙事、音画同步与精细运镜控制。
- 关键能力:
- OmniHuman-1:多模态数字人模型,输入单张照片 + 音频即可生成动作与口型匹配的数字人视频,支持复杂人体移动与自然走动。
- Face Motion Tokenizer:将表情细节离散化为“表情令牌”,实现情绪与微表情的 1:1 还原。
- DreamActor-M1:动作驱动技术,采用显式 + 隐式特征混合驱动方式,支持不同画幅与风格的动作迁移。
3.4 U-ViT 与扩散架构
- U-ViT 架构:U-ViT 是将 ViT 作为骨干网络的扩散模型架构,用于替代传统基于 CNN 的 U-Net,在 ImageNet 与 MS-COCO 上取得更优 FID 指标。
- 作用:在 Dreamina 的 Seedream / Seedance 等模型中,U-ViT 负责在潜在空间或像素空间进行去噪预测,是高分辨率图像与视频生成的核心计算模块之一。
- 长跳连接与 3×3 卷积:U-ViT 在浅层与深层之间使用长跳连接以保留低层特征,并在输出前可选 3×3 卷积块以抑制 Transformer 带来的伪影。
四、使用流程与交互设计
4.1 典型图像生成流程
- 选择模型:在 Dreamina 中选择 Seedream 5.0 / 5.0 Lite 或其他图像模型。
- 输入提示词:输入多语言提示词(英文更稳定),描述主体、场景与风格。
- 设置参数:选择分辨率(最高 2K)、画面比例与风格预设。
- 生成与编辑:生成图像后进入智能画布,进行局部重绘、扩图、消除与图层融合。
- 导出:下载无水印高清图,或继续用于视频生成与故事创作。
4.2 典型视频生成流程
- 选择模式:文生视频 / 图生视频 / 首尾帧控制。
- 上传素材:输入文本、上传首帧图或首尾帧图。
- 选择模型:Seedance 2.0 或其他视频模型,设置分辨率、时长与帧率。
- 运镜与节奏:调整镜头运动(推拉、旋转、平移)、速度与补帧超分参数。
- 后期编辑:使用对口型、动作模仿或故事模式进行二次编辑。
五、多语言与出海优化
- 多语言提示词:Dreamina 针对海外用户优化英文提示词,支持英语、日语、西班牙语等 10 种以上语言的文字生成与排版,减少乱码与排版问题。
- 英文排版优化:在海报、LOGO 等场景中,AI 自动调整字体、字间距与对齐,适合海外营销物料制作。
- 跨境电商适配:支持生成带英文的产品包装、宣传物料与社交媒体素材,适合出海品牌与跨境卖家使用。
六、商业模式与权益体系
6.1 海外版 Dreamina 定价结构(示意)
- 免费版:0 美元,每日约 225 共享代币,带水印、标准排队。
- 标准版:约 18 美元/月,增加额度,支持无水印与优先排队。
- 专业版:约 48 美元/月,更高额度与更优先生成。
- 极致版:约 84 美元/月,最大额度与最高优先级,适合批量生产。
注:具体价格与权益以官网实时信息为准。6.2 国内版即梦定价参考
- 免费版:新用户赠送约 800 秒视频额度 + 每日 260 积分,足够每日少量图片与短视频生成。
- 月度订阅:约 69 元/月,标准生成无限制、去水印。
- 年度会员:约 659 元/年,支持 4K 导出与更高额度。
七、典型应用场景
- 自媒体与短视频:为 TikTok / Instagram 等平台快速生成封面图、短视频素材与口播数字人视频。
- 电商与品牌设计:生成产品展示图、场景图与带英文的包装、LOGO,减少实拍成本。
- 跨境出海内容:制作多语言海报、产品视频与广告素材,适配北美、东南亚等市场。
- 数字艺术与 NFT:生成 2K 高清插画与动态视频,用于数字藏品与概念艺术。
- 教育与可视化:制作教学插图、科普动画与文化宣传内容,将抽象概念可视化。
八、平台生态与扩展能力
- 创意社区:用户可浏览他人作品、复用提示词与风格模板,实现“一键同款”创作。
- 火山引擎 API:即梦/Dreamina 的文生图 3.0/3.1、视频生成与数字人模型已通过火山引擎向企业开放 API,支持企业级集成。
- 多平台客户端:提供 Web 端与 iOS / Android App,移动端与桌面端数据互通,支持随时切换设备创作。
文章来源:本文由大国Ai导航(daguoai.com)基于 Dreamina 官方站点、百科条目与公开技术资料整理撰写,内容仅供参考,不构成任何投资或法律建议。
版权说明:本文版权归大国Ai导航所有,未经书面授权禁止转载或用于商业用途,如需引用请注明出处并保留本段声明。
数据评估
本站大国Ai提供的Dreamina都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由大国Ai实际控制,在2026年5月12日 下午5:47收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,大国Ai不承担任何责任。
相关导航


SkyReels A3视频模型

LPM 1.0

HeyGen AI视频

通义万象2.6

HappyHorse

谷歌veo3

