昆仑万维的 AI“万全”秘诀| AIGC 专栏
2025-04-24 08:55
米塔之家
2025-04-24 08:55
米塔之家
2025-04-24 08:55
订阅此专栏
收藏此文章
撰文 / 智沅 像素
审核 / 智枢

图片来源:网络

4.24 插图 5.png

编者按:「AIGC 专栏」是米塔之家推出的分享 AIGC 企业产品矩阵的专栏。以产业链的视角,从产品动态到企业动态。汇聚 AIGC 企业!


昆仑万维(股票代码:300418)作为一家全球领先的互联网平台型公司,昆仑万维逐渐在全球范围内形成了语音社交平台 StarX、社交信息分发平台 Opera、UGC 游戏平台 Ark Games、竞技娱乐平台闲徕互娱、投资板块等五大业务。


是国内领先的 AGI(通用人工智能)与 AIGC(生成式 AI)技术公司,成立于 2008 年,总部位于北京,在全球拥有超 2,000 名员工。


公司以“让每个人都能平等享受智能时代的红利”为使命,业务覆盖天工大模型、AI 搜索、元宇宙、视频生成及金融科技等领域,服务全球 100+ 国家用户,海外收入占比超 88%。



01.
AI 产品矩阵

天工”大模型

image.png 

2023 年 4 月 17 日,昆仑万维正式发布大语言模型“天工”,天工由昆仑万维与奇点智源联合研发,这是国内首个对标 ChatGPT 的双千亿级大语言模型,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。


天工 3.0 更是采用 4,000 亿参数 MoE 架构,是目前全球模型参数最大、性能最强的开源 MoE 模型之一


AI 音乐商用创作平台 Mureka

image.png
image.png

2024 年 8 月 14 日,昆仑万维发布推出 AI 音乐商用创作平台 Mureka,

全球首个音乐推理大模型,Mureka 自研基于 MusiCoT 的自回归模型音乐生成技术,生成速度比 Suno V4 快 50%,用户声音克隆误差<3%,日均生成歌曲 5 万首,10 种语言歌词支持。


AI 短剧平台

image.png

2024 年 8 月 19 日,昆仑万维发布全球首个集成视频大模型与 3D 大模型的 AI 短剧平台 SkyReels


引入 SkyScript 自研剧本大模型,能将分镜自动转换为连续视频,生成的场景和人物更加生动、一致;5-10 秒固定片段,分辨率 360p,FPS 24 帧。另外,单次可生成视频长度达 180 秒,基础分镜生成准确率 68%,单卡 4090 生成耗时 20 分钟 /10 秒。


AI3D 生成 Matrix-Zero

image.png

2025 年 2 月 15 日 昆仑万维正式发布自主研发的 Matrix-Zero 世界模型,实现 3D 场景生成与可交互视频生成技术突破。场景构建速度较传统工具快 300%,物理模拟误差<3%,8GB 显存支持 360 度自由探索,指令响应延迟<0.2 秒,布局准确率 93.1%,动态光影渲染效率提升 200%。


两大核心模块构成:

3D 场景生成大模型:用户仅需输入一张图片,即可生成可自由探索的真实 3D 场景,支持动态物理效果与多风格迁移。

image.png

可交互视频生成大模型:

以用户实时输入为核心驱动,生成动态互动视频,并精准控制视角移动,适配虚拟环境、沉浸式体验等场景需求。


AI 长视频生成模型 - SkyReels-V2


2025 年 4 月 21 日昆仑万维 SkyReels 团队正式发布并开源 SkyReels-V2,首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型。


支持生成 30 秒、40 秒的视频,且具备生成高运动质量、高一致性、高保真视频的能力,支持以 40 秒为基准无限扩展,分辨率 540p(实验室预研 720p),镜头类型识别 93.7%、表情标注 85%、摄像机运动参数化 89%,单卡 4090 生成 22 秒视频仅需 8 分钟,显存占用恒定 12GB。

4.22 封.jpg


SkyReels-V2 四大突破重塑视频生成范式创新:


多模态大语言模型(MLLM)

多模态镜头解析:结合大语言模型(MLLM)与子专家系统,精准识别主体类型、表情、动作及镜头语言(如运镜轨迹、光影构图)。  


开源生态赋能:支持开发者自定义视频描述规则,已应用于影视剧本可视化、广告分镜生成等场景。  

4.24 插图 4.png


多阶段预训练(Multi-stage Pretraining)

四阶优化流程:

     1. 概念平衡预训练:覆盖亿级通用视频数据(Koala-36M、影视剧库等)。  

     2. 运动强化学习:384 卡 GPU 训练 3,000 轮次,提升摄像机运动流畅度。  

     3. 扩散强迫后训练:支持 4K 分辨率、120fps 高帧率输出。  

     4. 高质量 SFT:通过艺术资源库(如专业摄影作品)提升色彩准确性与纹理细节。


强化学习(Reinforcement Learning)

强化学习驱动:通过半自动数据生成(I2V/T2V Distortion)训练模型,解决动态扭曲问题,生成流畅运动效果(如流体、布料模拟)。 


实时物理引擎:支持光线折射、碰撞检测等复杂物理交互,适用于科幻特效、机械动画等高精度需求。  



扩散强迫(Diffusion-forcing)

长视频生成效率提升:通过微调预训练扩散模型,将噪声时间表搜索空间压缩至 O(1e32),实现 30 秒至无限时长生成。。


滑动窗口稳定性:采用帧间噪声扰动技术,防止长视频生成中的累积误差,保障叙事连贯性。  


全场景覆盖的 AI 视频生成工具链

SkyReels-V2 以开源生态为核心,构建了覆盖全场景的视频生成工具链

1745401784752.png


02.
公司生态&动态


短剧全球化发行网络
旗下海外短剧平台 DramaWave(欧美市场)和 FreeReels(东南亚市场)已累计获得超 2309 万下载量,贡献 780 万美元收入。其中,DramaWave 在北美市场实现付费收入占比近 50%,FreeReels 通过免费模式快速获取东南亚用户 

4.24 插图 2 改.png


与丽江共探储能及多领域合作

三月,丽江市委书记带队赴北京走访昆仑万维集团,双方就丽江华坪全钒液流储能电池高端装备制造项目进行了深入交流,同时期待在绿氢发展、文旅首发、生物医药、人工智能等方面加强合作。 

4.24 插图 3.png


全球化市场拓展

昆仑万维的海外算力基建已形成"基础设施 - 调度系统 - 商业应用"的完整闭环,其"重资产投入 + 轻资产运营"的模式或将成为中国科技企业出海的新范式。


开源生态建设

发布 SkyReels-V2 开源版本,GitHub 星标数突破 10 万,社区开发者贡献插件超 2,000 款,覆盖虚拟偶像、教育课件等垂直领域。  


03.
写在最后


昆仑万维通过 “基建 - 算法 - 场景”铁三角布局,不仅限于算力和大模型,还拓展至图像 AI、音乐 AI、文本 AI 及编程 AI 四大领域,昆仑万维正将 AI 能力渗透至内容生产的每一环节,这场“万全”布局的背后,是昆仑万维对 “技术普惠 + 产业升级”双重使命的践行。


当 AI 视频生成从“片段实验”迈向“电影工业化”,当 3D 交互从专业工具变为大众创作入口,昆仑万维的野心已不止于技术领先——它正试图定义下一代数字内容的生产范式,并在全球市场中书写中国 AI 的“好莱坞式”叙事。


免责声明:本文为作者独立观点,不代表米塔之家立场。如因作品内容、版权等存在问题或其他任何异议,欢迎联系


【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

米塔之家
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开