欢迎进入某某教育官方网站!

咨询热线:400-123-4567

2027万亿视频市场将爆发!AI十年如何重塑内容产业?|新智元十周年峰会

  【新智元导读】十年AI浪潮,走到视频新纪元。新智元十周年峰会现场,潞晨科技创始人兼董事长尤洋带来了一个颠覆性的愿景:用AI将视频创作从「少数人的特权」变成「全民的狂欢」,他如何让「天价短剧」瞬间「平民化」,甚至预言AI将重塑教育的未来?

  可惜,那时的Sora并不对外开放,全球开发者和AI拥趸们只能隔着屏幕惊叹。

  于是,他们把当时「不可用」的Sora做成了「人人可用」的开源模型——Open Sora,并迅速在GitHub上斩获了2.6万颗星,成为全球开发者追逐的明星项目。

  在「新智元十周年峰会」上,潞晨科技创始人兼董事长尤洋为我们描绘了一个颠覆性的愿景:《Video Ocean:多模态AI Agent驱动下一代视频生成》。

  他希望用AI将视频创作从「少数人的特权」变成「全民的狂欢」,让「天价短剧」瞬间「平民化」,甚至预言AI视频生成将重塑教育的未来。

  2025年被称为智能体元年,AI开始自我迭代与进化,视频内容正经历一场前所未有的革命。

  突然间, 2023年,Runway就把它带到了我们面前,点点鼠标就能把文字变成视频。

  到了2024年,正如我们开头所讲,OpenAI直接扔出个王炸Sora ,能生成接近一分钟的高清视频。

  但高昂的成本、漫长的制作周期、生产效率低、角色人物一致性等核心痛点,让无数创意止步不前。

  他的履历带着传奇色彩:博士期间,他在加州大学伯克利分校创造了ImageNet和BERT等训练速度的世界纪录。

  昂贵的算力和缓慢的训练速度,让大模型难以真正普惠,而尤洋团队的目标,就是攻克这些瓶颈。

  经历了5年博士学术洗礼后,2020年毕业后,便加入了新加坡国立大学任职。

  2024到2025年这一年间,他开始关注多模态未来发展,便有了开头所说Open Sora和最新的Video Ocean。

  尤洋回忆道,个人求学与创业十年,也是AI加速进化,走到视频新纪元的十年。

  2015年,微软提出深层残差网络ResNet,在ImageNet竞赛中夺冠,为深度卷积网络的广泛应用奠定基础。

  相比1997年IBM的深蓝打败了国际象棋世界冠军卡斯帕罗夫,深蓝的胜利只是硬件速度和计算机的胜利。

  AlphaGo首次击败人类世界顶尖九段高手李世石,标志着深度学习+强化学习结合的重大突破。

  2021年,尤洋团队推出深度学习系统优化框架Colossal-AI,在学术和业界得到广泛应用。

  2023年,尤洋团队在全球学术界和开源社区实现RLHF(基于人类反馈的强化学习)首次复现。(注:RLHF是2022年初OpenAI在InstructGPT中首次系统提出)

  2024年,文生视频技术迎来重大突破,OpenAI发布Sora,被视为AI视频生成领域的分水岭。

  Video Ocean刚出的时候,迅速火爆全网,一键即可生成电影级特效!

  其实潞晨科技除了在AI视频生成领域颇有建树以外,还在算力领域进行了深耕。

  在今年的昇腾开发者大会上,潞晨科技展示了基于昇腾算力的高效强化微调方案,与昇腾联合完成了从训练、推理到调度的全链路优化:

  调度与通信:Ray完成NPU调度与HCCL通信管理,支持复杂分布式训练需求。

  可以说是为企业实现降本增效,加速智能业务基于国产软硬件体系快速部署落地提供了很大的支持。

  根据iResearch行业研究报告显示,2017年到2027年,中国网民视频与音频类用户消费时长将上涨14.2个百分点,从26.4%增长到40.6%。

  数据显示,中国在线视频(短视频及直播)市场收入从2017年约618亿元人民币快速增长到2021年约4994亿元人民币,五年复合年增长率(CAGR)高达68.6%。

  预计这一规模将持续扩张,于2027年达到1.326万亿元人民币,与此同时五年复合年增长率仍稳定在17.7%。

  根据GMI《全球多模态AI市场》2025-2034预测数据显示,全球多模态AI市场规模,预计从2024年16亿美元增长至2034年百亿美元规模。

  值得注意的是,美国独角兽LambdaLabs、Snapchat和Meta这些全球知名社交媒体巨头都在寻求AI的助力,足以说明这场变革势不可挡。

  美国顶级社媒科技公司Snapchat直接使用潞晨LAMB方案训练视频大模型

  当前,AI视频创作者和AI视频工具深度使用用户均面临两个核心痛点:制作速度慢和成本高。

  尤洋回忆,2024年,用一个10亿参数模型生成一个10秒钟720P视频居然需要6分钟。

  除此之外,创作门槛高、生产效率低、角色人物一致性等核心问题,也让有无数创意的视频制作用户止步不前。

  尤洋提到,在上一代文生视频产品中,AI视频制作的SOP还停留在手动撰写脚本、手动生成分镜头图片、手动将分镜头图片和脚本配对生成视频。

  但市面上很多生成的视频,常常出现「人物前后不一致」的问题,甚至在不同镜头里完全变了一个人。

  他认为,「多模态MaaS和多模态AI Agent能代表视频生成的未来。」

  他分析道,多模态MaaS,可以让创作者即开即用、还可以拓宽应用场景——不局限于社交媒体和电商领域、增强社区价值;

  多模态AI Agent则可以降低创作门槛、可同时处理多个视频,达到规模化生产、支持协作优化。

  即使你是一位没有掌握复杂软件技能的普通用户,Agent也可以把修改视频变得像修改一行代码或者一行文本一样简单。

  尤洋敏锐地捕捉到,AI不论对短视频和电商、品牌广告和政企宣传,还是影视和教育行业场景都有直接价值。

  比如如果对历史比较感兴趣的话,短视频平台有介绍林则徐虎门销烟的视频、有介绍玄武门之变的视频、有介绍淞沪会战的视频。

  今年这些AI生成视频已经能够满足一些抖音播主、YouTube播主、Snapchat播主做一些精度不是很高的视频。

  如果在给一些时间,到明年(2026年)下半年,视频大模型质量会进一步提升。

  等到2027年下半年,模型生成的视频质量已经很高的话,就真的有望做一些真正影视行业。

  教育行业也面临着一个长期痛点——「今天很多学生学知识学的效果不好,往往不是学生不够聪明,是因为老师跟他交流不在一个频道上。」

  每个学生都可以生成一个自己角度的Demo,比如学任何一个知识点,每个学生都可以生成20个视频,直到他理解为止。

  尤洋认为,未来的「AI视频生成」并不会局限于一个工具,更有可能的形态是一个能四两拨千斤的「团队」。

  Sora刚出来的时候,美国投资人Zak Kukoff曾预测,未来5年内,不到5人的团队就可以做出一个超过5000万美金票房的电影。

  他的理想就是通过视频生成这件事把大模型的能力真正发挥出来,解放AI生产力。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  1-2到0-0!曼城创14年耻辱纪录,再战曼联盼雪耻,英超165亿盛宴

  收获季来了,美国农民绝望哭诉:中国不买了,我只能全部销毁!“中国仍未下一单”,美大豆协会急了,催特朗普达成协议

  知名餐饮品牌大量关店,曾是业界排队王!上海情况如何?网友:是预制菜吗?

  毛骨悚然!俩姐妹探灵北京地铁一号线未开启的最后两站,有些东西你不得不敬畏!

  IG告别季后赛,解说直言Rookie状态差!wei采访承认:打野差距大