大模型时代:内容产业智变新浪潮
2025/5/30 16:39:08
在5月27日闭幕的第15届中国(深圳)国际文化产业博览交易会上,腾讯集团副总裁、腾讯研究院院长司晓以《大模型时代文化内容生产的范式革命》为题发表主旨演讲,系统阐述了大模型技术对文化内容生产、传播及产业生态的颠覆性变革。他指出,大模型已从“工具赋能”跃升为“生态重构”,推动文化内容产业从“专业主导”向“全民共创”跨越,并加速文化传承与创新的深度融合。
大模型时代:内容产业智变新浪潮第1张
以下是司晓的演讲内容整理。
人工智能的加速演进为文化内容领域带来新的发展机遇。这一波生成式人工智能的发展浪潮可谓“日新月异”。以2022年底ChatGPT面世作为大模型进入公众视野的重要节点,后续Midjourney、Gemini间隔数月陆续推出;而2025年未过半时DeepseekR1、Grok3等主流大模型就密集发布。毫不夸张地说,人类历史上进入了技术以“天”为单位进化的时代,从技术发展到应用落地的间隔也被压缩至无限短。
文化内容行业已成为智能实践的先锋领域。腾讯研究院曾调研了百余位各行业专家,凭借业态丰富、场景明确的优势,文化产业中的传媒、游戏等板块对大模型的应用程度,在十多个不同行业中处于中上游位置。广告、软件、教育这些以智力和创意为核心的产业,成为大模型渗透速度快的领域。
大模型时代:内容产业智变新浪潮第2张
来源:腾讯研究院行业大模型报告
多模态突破:内容生产从"单一维度"迈向"全感官沉浸"
多模态大模型技术持续突破,生成效率与质量显著提升。以腾讯混元为例,其文生图能力在一年内实现跨越式升级:混元图像2.0支持边输入文字边实时生成图像,用户可即时调整美术风格、特效等视觉元素,相较此前需等待完整生成后再修改的模式大幅优化。文生视频领域同样进步明显,2023年,有网友利用AI工具仅用5晚便完成《流浪地球3》“概念预告片”制作,引发导演郭帆关注。到今天,主流模型如混元、可灵到刚刚发布的谷歌Veo3,已经逐步有效解决手部穿模等画面缺陷,生成视频的连贯性与物理模拟能力显著增强,甚至可以为画面同时匹配准确的人声和音效。面向影视生产的Flow等专业工具及国内同类软件已实现脚本、分镜、镜头控制等多项专业能力集成,展现惊人进化速度。
在文生图片的扩散模型基础上,叠加深度参数则升级为3D生成。腾讯在文生3D领域有诸多创新:混元3D生成模型2.5版本较上一版本,总参数量提升了10倍,能够实现高清的几何细节建模。我们的同事已通过文生3D功能结合家用3D打印机,制作出原创玩具模型。未来,用户不仅可以购买创意服务,更能自主构思创意,通过家用打印机直接输出。
大模型时代:内容产业智变新浪潮第3张
大模型对世界的理解与交互能力也在增强。我曾将手机作为GPT-4o大模型的“眼睛”,问它窗台上有几个公仔。它不仅准确回答了类型和数量——四个腾讯公仔,还在追问下识别出后方隐藏的一只兔子。尽管大模型的理解能力并非人类意义上的物理世界认知,但其基于视觉与推理能力的实现方式已具突破性——例如谷歌新发布的通用AI智能体项目ProjectAstra,便如同钢铁侠的个人助理,可通过眼镜或手机指导洗衣等日常操作,并与现实世界实现更自然交互。这些未来硬件与大模型结合的创新,必将为我们的生活带来更多便利。
大模型时代:内容产业智变新浪潮第4张
虽然我不是技术专家,对技术细节了解有限,但反而更能跳出细节去审视大模型当前的缺陷。现阶段,用户对大模型部分能力的不满,本质上源于对其"许愿"般的进化期待——按照当前的进化节奏,诸多技术瓶颈将在未来长以年、短以月为单位的
下一页
返回列表
返回首页
©2025 人工智能世界_专注人工智能领域,汇集人工智能技术资料 电脑版
Powered by iwms