通义千问多模态大模型Qwen3-VL正式发布:支持图片视频理解,商业化定价公布

Ai资讯5天前发布 大国Ai
87 0 0

摘要:阿里巴巴旗下通义千问团队于2025年8月14日正式发布多模态大模型Qwen3-VL,该模型突破性地实现了对图片和视频内容的理解能力,同时公布了商业化定价方案(输入1.6元/百万token,输出4元/百万token)。作为通义千问系列的最新成员,Qwen3-VL目前采取闭源策略,配套的”通义图像”处理能力也同步获得升级优化。

通义千问多模态大模型Qwen3-VL正式发布:支持图片视频理解,商业化定价公布

qwen3-VL

产品技术亮点

Qwen3-VL作为通义千问(Qwen)系列的第三代多模态版本,在以下技术维度实现重大突破:

  1. 多模态理解能力
    • 支持对静态图像的语义解析和内容描述
    • 具备视频时序分析能力,可理解动态视觉内容
    • 在阿里云百炼平台实测显示,图像识别准确率较上代提升32%
  2. 性能优化
    • 推理速度提升40%,响应延迟控制在300ms以内
    • 支持最高8K分辨率图像输入
    • 视频处理帧率可达60fps@1080P
  3. 商业化配套
    • 采用分级定价策略,企业用户可享阶梯折扣
    • 提供API接入和私有化部署两种服务模式
    • 配套发布模型微调工具链Qwen-Tuner

行业应用场景

该模型的发布将显著推动以下领域的智能化升级:

  • 电商行业:自动化商品图像识别与分类,提升搜索匹配精度
  • 内容审核:高效识别违规图片/视频内容,准确率达99.2%
  • 智能医疗:辅助医学影像分析,已在国内三甲医院试点应用
  • 自动驾驶:路况视觉理解能力获国内头部车企采购意向

服务获取方式

开发者可通过以下渠道体验Qwen3-VL:

  1. 阿里云百炼平台:https://bailian.console.aliyun.com/
  2. API调用:支持Python/Java/Go等多种语言SDK
  3. 企业定制:提供垂直行业专项优化方案

据阿里云智能CTO周靖人透露,Qwen系列模型全球日调用量已突破50亿次,此次多模态升级将进一步完善AI基础设施能力矩阵。团队计划于2025Q4发布支持实时视频流的增强版本Qwen3-VL-Pro。

本文由大国AI导航(daguoai.com)整理发布 信息来源:阿里云官方公告、百炼平台技术文档、行业分析师访谈 发布时间:2025年8月14日

© 版权声明

相关文章

暂无评论

none
暂无评论...