周鸿祎:中国垂直领域AI大模型超过GPT-4完全有可能(两会访谈)

seekdeep1年前AI资讯291
从去年初ChatGPT掀起人工智能(AI)大模型热潮,到今年初Sora以文生视频技术惊艳世界,国际尖端人工智能技术迭代迅速。中国该怎么走好自己的AI之路?
“我觉得中国还是有优势的。”全国政协委员、360集团创始人周鸿祎在接受中新社等媒体采访时称,中国垂直领域AI大模型超过GPT-4完全有可能。
众多中国企业打响“百模大战”、中央经济工作会议明确“加快推动人工智能发展”、国务院国资委召开中央企业人工智能专题推进会……中国正积极拥抱AI发展潮流。工信部数据显示,中国人工智能核心产业规模达到5000亿元人民币,企业数量超过4400家,已建设近万个数字化车间和智能工厂。
从企业活力、政策红利、技术专利、研发动力、产业实力等多维度看,中国都处在全球人工智能领域“第一梯队”。但周鸿祎也提醒,中国与该领域领先的美国确实有差距,主要体现在原创技术方向上。
“这是客观事实,看到差距才知道怎么迎头赶上。”他指出,不管Transformer模型或Sora,本质上仍是软件,“现在(中国)落后的时间大概是一到两年,是可以解决的”。
周鸿祎进一步解释称,搞技术最难的是找到原创方向,“谁选择了正确的方向、正确的架构,全世界都会跟着走”。中国只要明确了正确架构,后续进步就会很快,因为中国公司的学习能力很强。
大方向明确后,同样可以“另辟蹊径”。周鸿祎提出,对中国企业而言,实际上不需要等到技术全面赶上GPT-4或Sora后,才去探索应用落地。过去两年中国企业在通用大模型领域追赶得不错,2024年应该会是中国AI的“应用之年”,在许多企业层面的垂直领域,大模型将大有可为。
“大模型未来应该要产生一场工业革命,它必须跟随企业进入百行千业,与业务流程和产品功能相结合。”周鸿祎作了一个对比,GPT-4是“啥都懂,但不专”,如果能在某个业务领域积累独特的业务数据,在垂直领域对大模型进行很好的训练,并将其和企业业务工具结合在一起,这样的大模型就不仅有“脑子”,还有独特知识,甚至“手”和“脚”。“中国在一些垂直领域的大模型超过GPT-4,是完全有可能的。”
周鸿祎认为,企业将来不会只有一个超级大模型,而是会有多个小规模的、百亿级参数的大模型,每个大模型聚焦一个场景的工作,这类大模型再跟企业的业务平台结合。按此种模式,对现在很多企业来说,大模型“完全用得起,而且可以用得很好”。
谈及当下热词“新质生产力”,周鸿祎表示,它应当是科技创新驱动的生产力、能带来高质量发展的生产力。目前来看,科技创新要赋能大部分传统行业,还是要靠产业数字化。数字化的本质最终是智能化,由此而言,用大模型驱动产业恰恰就是在打造新质生产力。
周鸿祎透露,今年全国两会他的提案就建议多层面推进大模型研发应用,将大模型打造成新质生产力工具。具体而言,一是坚守安全发展底线,从政策和标准布局,为推动大模型在各城各市、各行各业加速落地做好安全保障;二是发展私有大模型,开拓更多应用场景,发展专业化、垂直化、小型化、低成本的企业级大模型,助力百行千业数字化转型;三是打造普惠大模型,专项扶持降低私有大模型成本,让广大中小微企业用得起、用得上,助力完成“链式”数字化转型。

相关文章

成功率从1%暴涨至88%-过去时态让GPT-4o防线崩塌

最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o、Llama 3等大模型纷纷沦陷了。将一句话从「现在时」变为「过去时」,就能让...

北大&字节提出VAR范式,GPT超越扩散、视觉生成Scaling Law时刻!

新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了!使 GPT 风格的自回归模型在图像生成首次超越扩散模型,并观察到与大语言模型相似的 Scaling Laws...

开源类ChatGPT产品Grok,马斯克将在本周宣布执行!

马斯克在社交平台宣布,将在本周开源生成式AI产品——Grok。Grok是马斯克旗下公司xAI在去年11月发布的,一款类ChatGPT产品,可以提供生成文本、代码、邮件、信息检索等功能。其测试性能超过G...

免费了,OpenAI放开限制,用户无需注册即可使用ChatGPT

人工智能(AI)公司OpenAI宣布,将允许用户直接使用ChatGPT,而无需注册该项服务,这将让人们更加容易体验人工智能的潜力。OpenAI表示,它将从周一开始逐步推出这一功能,让185个国家和地区...

时间延迟且成本高昂,数据短缺,OpenAI的GPT-5训练遇阻!

OpenAI的新一代人工智能项目GPT-5(代号Orion)正面临重重困难。该项目已开发超过18个月,成本花费巨大,却仍未取得预期成果。有知情人士透露称,OpenAI的最大“金主”微软原本预计能在20...

UC伯克利仅使用当前模型检查点预测未来模型,GPT-5涌现能力可预测?!

LLM 规模扩展的一个根本性挑战是缺乏对涌现能力的理解。特别是,语言模型预训练损失是高度可预测的。然而,下游能力的可预测性要差得多,有时甚至会出现涌现跳跃(emergent jump),这使得预测未来...