你好,游客 登录 注册 搜索
背景:
阅读新闻

打破次元,Xmax AI发布虚实融合实时交互视频模型

[日期:2026-02-10] 来源:  作者: [字体: ]

    摘要:

    当AI视频还在卷时长与画质时,XmaxAI另辟蹊径,用毫秒级延迟的实时交互模型X1,开启了从「看视频」到「玩视频」的交互范式革命。

    如果2024年我们还在为Sora模拟的流体视频惊叹,那么在2026年的今天,单纯的高清视频已经在光速发展的AI世界随处可见。

    当你对着屏幕里的那个AI虚拟形象,无论多么逼真,终究只是一段“被播放”的像素。AI视频生成实际上仍被禁锢在“预制内容”的旧范式中。而如今打破这层次元壁的,是一家由前华为「天才少年」创立的初创公司——XmaxAI。

    近日,XmaxAI正式发布全球虚实融合的实时交互视频生成模型——X1。不同于当前主流文生视频模型聚焦影视内容生产与工业流程重构,X1选择了另一条更为硬核,且鲜有人涉足的征途:实现毫秒级的实时视频生成和低门槛的手势交互,并将虚拟内容实时、无缝地融入现实物理空间。

    它意味着着AI视频正在从“被动的消费内容”,跃迁为“共创体验”。我们将可以调动现实与虚拟世界的任何一粒像素。

    手机对准桌面,选取一张滚球兽的照片。下一秒,它就“脱屏而出”,立在你的桌面上东张西望。你伸出手,它先是警惕,随后亲昵地蹭向你的手心;你轻轻一捏,它会给出Q弹的物理反馈;摊开手掌,它甚至能被你稳稳“托”住。

    这就是X1,不需要复杂的Prompt(提示词),不需要漫长的云端渲染等待,仅凭一个手机摄像头和符合直觉的手势,它就能让幻想挣脱屏幕,与现实无缝融合。目前,XmaxAI已通过技术演示应用X-cambeta开放了X1模型的能力体验,并可以通过TestFlight下载。

    一、告别“只能看”,AI视频“人人可玩”

    过去一年,全球AI视频生成领域呈现出爆发式增长态势。全球AI视频生成领域呈现出“神仙打架”的繁荣景象。数据显示,2024年全球相关市场规模已达6.148亿美元,Sora、Runway等行业巨头纷纷在画质、时长和分辨率上展开激烈角逐。然而,纵观行业生态整个赛道,大多数技术路线仍聚焦局限于“文生视频”的单向输出,主要服务于影视、广告等专业领域的生产力需求。对于普通用户而言,复杂的操作流程高昂的操作门槛、漫长的生成等待时间,以及内容本身的缺乏低互动性,使得AI视频生成始终难以真正融入日常生活。

    XmaxAI敏锐地捕捉到了这一行业痛点:AI视频要真正走向大众,不仅需要进一步降低门槛,更要从“生成结果”进化为“生成体验”。为此,XmaxAI选择了一条截然不同的技术路线:虚实融合+实时交互。不仅要生成画面,还要让画面理解现实,并允许用户用本能的手势去参与。

    二、XmaxAI四大核心玩法

    基于X1模型的实时生成能力,XmaxAI落地了四大核心玩法:

    1.次元互动:打破次元壁的触摸

    任意上传一张角色图(动漫IP、宠物照片、毛绒玩具),并通过手机摄像头对准现实平面,X1模型即可将其实时置入现实场景中。当你抚摸屏幕中的兔子时,X1会实时生成它“转头蹭手”的动态响应;当你的手指划过它的眼睛,还能看到绒毛因触碰而发生的细微形变。

    2.世界滤镜:万物皆可“风格化”

    上传一张梵高画作或乐高积木图,摄像头所捕捉的现实画面即可实时全域风格化转化。这是一整套“世界重绘”系统:当你对着镜头挥手、摇头,画面中那个变成“乐高人”或“二次元纸片人”的你,会同步保持风格一致性与动作连贯性。

    3.触控动图:指尖轻划唤醒静态图片

    上传一张照片,在触摸屏上拖拽照片中角色的耳朵,它会跟着摇头;拖动嘴角,它会露出微笑。你甚至可以上传自家猫咪的照片,通过触控让它挥拳、跳舞。

    4.表情捕手:社交破冰好物

    镜头对准朋友,选择一个“愤怒”或“大笑”的Emoji,AI会瞬间捕捉对方人物特征与神态,实时生成一个神态精准、魔性十足的动态表情包。

    三、华为“天才少年”,攻克算法与工程的世界难题

    在业内人士看来,X-cam看似简单的“好玩”背后,其实是高技术门槛的工程化胜利。

    为了为了破解“快速响应”与“精准意图理解”这一世界性难题,解决实时性与精准意图理解的难题,团队创新了端到端流式重渲染架构,实现了帧级自回归DiT模型。通过多阶段蒸馏压缩与对抗训练,扩散采样速度提升了百倍。同时,团队构建了统一交互模型架构,融合空间三维关系与屏幕二维操作,使模型能精准解析“捏”、“拖拽”等复杂用户意图。针对虚实融合数据稀缺的困境,Xmax.AI还搭建了半自动化合成管线,在筑牢行业技术壁垒的同时,也为我国AI视频生成领域储备了珍贵的数字资产。建立了坚实的行业壁垒。

    硬核技术的突破,源自一支兼具算法与工程能力的硬核团队。XmaxAI团队汇聚了来自华为“天才少年”计划、清华大学KEG与HCI实验室、香港科技大学(广州),以及字节跳动、快手等企业的人才。

    四、X1:PlaytheWorldthroughAI

    对于XmaxAI团队而言,X1模型和X-cam应用只是一个开始。他们在试图定义全新的内容交互范式,以及搭建下一代内容交互引擎。正如XmaxAI的Slogan所言:PlaytheWorldthroughAI(用AI玩转世界)。

    技术,终将让幻想触手可及。

推荐 打印 | 录入:admin | 阅读:
相关新闻      
本文评论   
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
-->