9月24日,在2025杭州云栖大会上,阿里发布通义万相Wan2.5 preview系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型,其中,通义万相2.5视频生成模型能生成和画面匹配的人声、音效和音乐BGM,首次实现音画同步的视频生成能力,进一步降低电影级视频创作的门槛。即日起,用户可在阿里云百炼平台调用API,或在通义万相官网直接体验。
全新的通义万相2.5在创作能力上实现了全面升级:视频生成时长从5秒提升至10秒,单次生成可实现更完整的剧情故事;支持24帧每秒的1080P高清视频生成,画面质量进一步提升,满足电影级场景的创作需求;与此同时,模型指令遵循能力进一步提升,在视频生成任务中可理解运镜等复杂连续变化指令控制,图像编辑任务也可以跟随指令一键实现人物变身、风格变化等效果。
据介绍,相比前几代通义万相模型,通义万相2.5在技术架构上实现了重大更新:首次采用原生多模态架构,在同一套框架下支持理解和生成等多种任务,支持文本、图像、视频、音频多种模态的输入和输出,能实现音画同步的视频生成等多模态能力。用户输入提示词即可生成人声、环境音效和背景音乐,并且精准与画面内容、人物口型匹配,让视频演绎更加生动形象。通义万相2.5也支持输入一段音频作为参考,来驱动文字或图片生成音画同步的视频。
例如,输入Prompt:仰视角度拍摄,全景,日光,晴天光,侧光,暖色调,中心构图。一名外国男子在城市公园的水泥广场上玩滑板,他约二十多岁,身材健硕,深色短发藏在黑色棒球帽下,身穿深灰色连帽上衣和黑色工装裤,脚踩一双黑白拼色运动鞋。镜头从低角度仰拍,突出其腾空动作的张力。他站在滑板上加速前行,身体前倾,双臂自然张开以维持平衡;随后猛然跃起,右脚轻踢板尾,滑板在空中完成180度翻转,他迅速下压接住滑板,双脚精准落回板面,稳稳着地后继续向前滑行。背景中,三两名滑板者在远处滑行穿梭,梧桐树叶在微风中轻轻摇曳,阳光穿过树叶间隙洒下斑驳光影,投射在地面和滑板轮迹上。伴随着节奏鲜明的都市电子音乐,背景传来轮子摩擦地面的沙沙声与远处隐约的交谈声。男子落地瞬间轻哼一声“Yeah!”,语气轻快自信。
通义万相能精准理解复杂指令的多个关键词,生成一段男子滑板的动感视频,不仅实现动作、拍摄角度和光影遵循指令,视频展现的人声、滑板滚动音效以及背景音也和画面内容、指令保持同步。
输入一张图片和一段文字,通义万相可生成音画同步的视频
此次,通义万相2.5还全面升级了图像生成能力,可生成中英文文字和图表,包含复杂文字排版、艺术海报、流程图、架构图等,同时支持图像编辑功能,输入一句话即可完成P图。
通义万相模型家族已支持文生图、文生视频、图生视频、人声生视频和动作生成等10多种视觉创作能力,累计生成3.9亿张图片、7000万个视频。自今年 2 月以来,通义万相已连续开源20多款模型,在开源社区和三方平台的下载量已超3000万,是开源社区最受欢迎的视频生成模型之一。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
9月24日,2025云栖大会现场,阿里云CTO周靖人接连发布了七款大模型技术产品。七款技术产品覆盖语言、语音、视觉、多模态、代码等模型领域,在模型智能水平、Agent工具调用以及Coding能力、深度推理、多模态等方面均实现突破。在大语言模型中,阿里通义旗舰模型Qwen3-Max全新亮相,性能超过G
9月24日,阿里云在云栖大会上宣布新一轮全球基础设施扩建计划:将在巴西、法国和荷兰首次设立云计算地域节点(region),并将扩建墨西哥、日本、韩国、马来西亚和迪拜的数据中心,以便更好服务全球客户日益增长的AI和云计算需求。目前,阿里云在全球29个地区运营91个可用区,是中国最大、亚太第一的云服务商
9月24日,在2025云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭表示,当下行业处于“自主行动”阶段,AI掌握工具使用和编程能力以“辅助人”。记者获悉,阿里云百炼平台已有超20万开发者开发了80多万个Agent。同时,通义灵码插件下载量已超2200万,累计为开发者生成超60亿行
记者在2025云栖大会上获悉,网易已接入通义千问(Qwen)打造游戏自动测试系统,帮助游戏研发提效50%。网易集团执行副总裁、网易雷火事业群负责人胡志鹏在演讲中透露,在游戏开发中,代码编写与测试调试是非常消耗时间的环节。当前,网易借助Qwen3-coder等模型正在推动AI辅助智能生成代码,打造自动
9月24日,在2025杭州云栖大会上,阿里发布全新语音模型家族通义百聆,通义百聆涵盖语音识别大模型Fun-ASR、语音合成大模型Fun-CosyVoice。Fun-ASR基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性,可实时处理10多种语言;Fun-CosyVoice可提供
9月24日,在2025杭州云栖大会上,阿里发布通义万相Wan2.5preview系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型,其中,通义万相2.5视频生成模型能生成和画面匹配的人声、音效和音乐BGM,首次实现音画同步的视频生成能力,进一步降低电影级视频创作的门槛。即日起,用户可在阿里云
9月24日,在杭州召开的云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表主旨演讲,他认为实现通用人工智能AGI已是确定性事件,但这只是起点,终极目标是发展出能自我迭代、全面超越人类的超级人工智能ASI。吴泳铭首次系统阐述了通往ASI的三阶段演进路线:第一阶段:“智能涌现”,AI
9月24日,2025云栖大会开幕,阿里通义旗舰模型Qwen3-Max重磅亮相,性能超过GPT5、ClaudeOpus4等,跻身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)两大版本,其预览版已在ChatbotArena排行榜上位列第三,正式版性可望再度实现突破。Q
文/道哥美国设计软件公司Figma近期在纽约证券交易所挂牌上市,首日即上演“狂飙”行情——发行价定每股33美元,开盘报价85美元,较发行价翻倍。首日收报115.50美元,较发行价大涨约250%,市值飙升至近670亿美元,创下近30年来同等规模美股IPO的最大单日涨幅纪录。然而,随着短线资金获利了结,
8月16日,卢松松非常荣幸的成为了一名《2025世界人形机器人运动会》的观众。这是一场超酷的机器人运动会,也是人类给机器人办的第一届奥运会,来自16个国家的280支队伍会参加500多个比赛项目。看了一天的比赛,晚上就回来写文章,编辑短视频。先说感悟:(1)这是人类首次给机器人办的第一届运动会,史无前