解锁大模型时代的无限可能,从GPT-3到Sora

seekdeep2年前AI资讯723

从2020年OpenAI的GPT-3到2023年的GPT-4再到2024年的文生视频模型Sora,我们见证了大模型领域创新速度之快。从百度、阿里和360等为代表的头部科技企业率先入局到互联网公司、AI企业、初创企业、研究机构和科研院校的竞相布局,我们目睹了大模型领域发展势头之盛。过去的一年,大模型产业的战略地位持续提升,资本市场关注度不断增强。放眼海外,大模型竞争格局初现;聚焦国内,“百模大战“鏖战正酣;展望未来,多模态大模型将发挥较大潜力。


01 大模型政策密集发布


2023 – 2024年围绕顶层设计、场景落地和区域发展维度的大模型相关政策密集出台,各类政策的密集发布为大模型产业的快速发展和商业化落地创造了良好政策环境,同时也表明大模型产业在我国战略地位的持续提升,将成为未来一段时间内的重点发展方向。





02 资本市场关注度持续上升


2023年人工智能领域的资本热度相对下滑,但AIGC/大模型在资本市场的关注度持续提高,并出现了智谱AI、百川智能等融资金融超过20亿人民币的事件。


2023年AI领域融资事件总数为585件,技术算法层融资事件182件,占AI领域的31%。在技术算法层细分领域的融资中,AIGC/大模型累计融资156.13亿元,获投公司数90家,融资事件数111件,在包括基础设施和行业应用的所有AI细分领域中,三项指标均领先与行业平均水平。




03 国内“百模大战” 步入深水区


放眼海外大模型竞争格局,目前已形成较为清晰的OpenAI和微软领先,谷歌追赶,Meta发力开源的格局,通用大模型能力相对成熟,应用生态呈现繁荣发展态势。2024年2月16日OpenAI发布的文生视频模型Sora再次引发业内广泛关注,推动AI多模态领域飞跃式发展,AI创作等相关领域将迎来深度变革,持续巩固公司在大模型产业中的领先地位。


聚焦国内大模型的发展历程,2023年2月开始以百度、阿里和360等为代表的头部科技企业陆续推出各自的大模型,2023年6月开始,国内涌现出众多的通用大模型和垂类大模型,目前国内公布的大模型数量已超过200个,市场竞争激烈,大模型行业呈现出“百模大战”的竞争格局。国内大模型产业玩家类型多样,包括头部科技企业(阿里巴巴、百度、腾讯、华为、字节等)、传统AI企业(科大讯飞、商汤科技)、创业公司(百川智能、智谱AI)和研究机构(中科院、复旦大学、上海人工智能实验室)等,头部企业和传统AI企业具备技术、资金和人才优势,创业公司能够迅速响应市场变化提供定制化的解决方案,研究机构在理论研究和技术创新方面优势明显。



04 多模态大模型潜力较大


OpenAI最新发布的文生视频模型Sora推开了新世界的大门,文生视频技术加速演进。作为划时代的文生视频大模型,Sora具有四大核心能力。第一,视频生成能力,Sora能够根据用户提供的文本描述生成长达60S的视频。第二,语言理解能力,利用GPT技术将简短的用户提示转换为更长的详细转译,并将其发送到视频模型。第三,图片生成能力,Sora可以根据用户需求,生成可变大小的图像,最高可达2048 × 2048分辨率。第四,多镜头生成能力,Sora具有3D一致性、较长视频的连贯性和对象持续性,可以在单个生成的视频中创建多个镜头,同时保持角色和视觉风格的一致性,有效地模拟物理和数字世界。


Sora的横空出世进一步增强了业界对于多模态大模型下游应用的关注和期待,未来多模态大模型在视频制作、自动驾驶、营销推广、教育和医疗等领域都将发挥巨大作用。在视频制作领域多模态大模型可以根据剧本或概念生成初步的视觉素材和视频内容,有效提升创造者效率。在自动驾驶领域中,多模态大模型可以整合来自摄像头、雷达、激光雷达等多种传感器的数据,提供更准确的环境理解和决策支持。在营销推广领域中,多模态大模型可以根据市场趋势和消费者偏好,生成吸引人的广告内容,包括视频、图像和文案,有效提高销售转化率。在教育领域中,可以实现教学资源自动生成、人机协同过程支持和教师教学辅助,有效提升教学效率。在医疗领域中,可以整合医学影像、临床记录和患者数据,辅助医生进行更准确的诊断。


随着大模型产业的快速发展,如何降低大模型训练和部署的成本;如何应对大模型带来的安全性挑战;在算力资源有限的情况下市场竞争格局将会如何变化;如何协调“大模型”与“小模型“的关系重塑生产力工具;如何最大化发挥大模型产业赋能效应推动新质生产力发展;伴随着大模型的快速发展,这些话题都是我们需要持续研究和探索的课题。


05 关于 2024 GDC 全球开发者先锋大会


全球开发者们,注意了!!!一年一度的全球开发者先锋大会(GDC)即将在上海掀起科技风暴!!!这不仅仅是一场大会,而是所有代码高手、科技狂热者们的盛大节日!!!GDC 缘起总理在达沃斯世界经济论坛打call的WAIC世界人工智能大会,作为WAIC聚焦科技和人才力量的重要板块,进化到如今的全球开发者嘉年华,已化身顶尖技术风向标,汇集全球顶尖开发者、科技先锋、企业家和学术翘楚,开启一场科技交流狂欢盛典。


2024 GDC 将在上海徐汇滨江召开,这里是科技与文化交汇的前沿阵地,为大会带来无限活力与创新灵感。大会部分同期活动也会在临港等地举行。临港是2023 GAIDC的举办地,有多项重要成果发布,引起各方关注和赞誉。今年我们将开发者的范畴从AI扩展到整个技术领域,从GAIDC到GDC,更是思维的飞跃,让“多元共生”不再是想象。


2024 GDC 主题是“开发者的‘模’力之都”。今年大会全面升级,1场开幕式、5场前沿技术讲坛、10+场平行技术讲坛,及X场工作坊、10000 m2互动体验、竞技场、创客集市、场外活动等,聚焦大模型、人形机器人、开源开放、AIGC等前沿话题,一网打尽科技界的最新动态。


快来2024 GDC,与全球开发者同台竞技,共同探索科技的边界。这是一场科技界的饕餮盛宴,错过再等一年!


相关文章

微软Windows系统出现“史上最大规模IT故障”;OpenAI上线GPT-4o mini

NO.1 OpenAI上线GPT-4o mini7月19日,OpenAI突然官宣并上线了一款“小模型”GPT-4o mini,被团队描述为最智能、最实惠的模型,其性能和价格均已赶超GPT-3.5 Tu...

OpenAI员工:没什么科学突破了,接下来只需要工程.GPT-5被曝不及预期!

OpenAI下一代旗舰模型被曝提升不如预期。具体指代号“猎户座”(Orion)的模型相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。或许这也是奥特曼曾说,可能不会把新模型命...

GPT-4o语音模式部分开放,秋季覆盖所有付费用户

继此前 OpenAI 方面在今年 5 月发布多模态大模型 GPT-4o,原计划今年 6 月开放语音模式的测试,随后以 " 需要改进模型检测和拒绝某些内容的能力 " 为由推迟后。当地...

又一次GPT式创业的Sora!

Sora让整个行业又兴奋起来。字节辟谣中国版Sora,周鸿祎火速“追星”,李一舟趁热卖课,一众上市公司夹杂着“颠覆性、里程碑、加速器”等关键词舞动资本市场。又一次创业机会,还是新一轮赶超焦虑,是看待S...

6小时收藏破5000次,利好国产GPU。DeepSeek开源第一弹!

6小时收藏破5000次,利好国产GPU。DeepSeek开源第一弹!

2月24日,在上周DeepSeek宣布本周将是开源周(OpenSourceWeek),并将连续开源五个软件库后。今日上午9:30时许,DeepSeek宣布开源了本次开源周首款代码库——针对Hopper...

争夺“中国ChatGPT”心智定位,零一万物首次出新To C 李开复再出马!

李开复表示,大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段,今年会迎来“大模型应用爆发元年”。他同时预测,明年下半年,随着大模型推理成本的大幅度下降,人们将迎来大模型普惠应用的井喷期。...