GPT-5红队测试邮件曝光,数十亿美元超算26年启动。

seekdeep1年前AI资讯390

陆续有网友晒出OpenAI发给自己的红队邀请邮件,看起来,GPT-5已经进入红队测试了?网友们纷纷展开畅想,对Sam Altman在线「催更」。另有消息曝出,OpenAI的一个mini版数十亿「星际之门」,最快2026年就会启动。


GPT-5已经开始红队测试了?


就在这几天,网上已经有多人晒出了OpenAI发给自己的红队录取通知书。



此前有传闻说,GPT-5将于今年6月发布。看起来,红队测试与模型发布的时间线十分吻合。



有网友直接晒出了自己收到OpenAI邮件邀请的截图。



这倒是和此前Sam Altman的说法对上了。



据悉,GPT-5早已为大家准备好,只是发布风险太大了,所以还得往后延。



三个月就能用了?


不过还有人表示,先别急,这些人只是收到了红队邀请测试而已,并没有提及具体模型。



有可能是他们填了如下的申请信息之后,才收到了邮件。



安全测试对于新版GPT如此重要的原因,一方面是ChatGPT已经有了非常大的用户数,如果在安全性上出问题,OpenAI可能也会面对像谷歌一样的舆论压力。


另一方面,To B业务是OpenAI的主要收入来源,定制化的ChatGPT能大大增强各个企业的业务能力和效率。


有人表示,红队测试会持续90-120天。



如果此次红队测试就是针对GPT-5的话,那么三个月内,我们应该就能用上它了!



而在坊间,这一传闻让群众们沸腾了!他们早已按捺不住对于GPT-5的猜测和畅想。


比如,GPT-5的上下文窗口会达到多少?



目前,Gemini 1.5 Pro是1M,Claude 3是200K,GPT-4是128K,不知道GPT-5会突破怎样的惊人纪录。



大家纷纷列出自己对于GPT-5的愿望清单——


比如10Mtoken的上下文窗口,闪电般的快速干扰,长期战略规划和推理,执行复杂开放式操作的能力,GUI / API导航,长期情境记忆,始终处于隐形状态的RAG,多模态等等。



有人猜,或许GPT-5会和Claude 3一样,提供几种不同的型号。



有人总结了目前关于GPT-5和红队的最新谣言和传闻,大致要点如下——


-OpenAI预计于今年夏天发布GPT-5,部分企业客户已收到增强功能的演示;


-GPT-5「实质性更好」,相比GPT-4进行了重大升级。它需要更多的训练数据;


-GPT-5的潜在功能包括生成更逼真的文本、执行翻译和创意写作等复杂任务、处理视频输入以及改进推理;


-Sam Altman表示,GPT-5仍在训练中,没有确切的发布日期,广泛的安全测试可能还需数月。然而,他确认OpenAI今年将「发布一个惊人的新模型」。



在3月29日,获得内部信息的Runway CEO兼AI投资人Siqi Chen就称,GPT-5已经在推理方面取得了意想不到的阶跃函数增益。


它甚至可以靠自己就独立地弄清楚,如何让ChatGPT不用每隔一天就登录一次。



Ilya看到的东西,也许就是这个?



这是不是就意味着,在OpenAI内部,已经实现了AGI?!如果是真的,这也太惊人了。



「我不相信,只有AGI才能实现这样的能力」。



总之,网友们纷称,根据泄露的待办清单显示,OpenAI的下一项任务,就是发布GPT-5了!



大家纷纷呼唤Altman,是时间放出GPT-5了,别太吹毛求疵了,我们要求不高。



红队测试上阵,确保GPT-5安全


早在23年9月,OpenAI就曾官宣招募一批红队测试人员(Red Teaming Network),邀请不同领域专家评估模型。



不同领域专家组成的红队去寻找系统漏洞,成为确保下一代模型GPT-5安全的关键。


那么,红队测试人员一般都需要做哪些工作?


AI红队攻击的类型主要包括,提示攻击、数据中毒、后门攻击、对抗性示例、数据提取等等。


「提示攻击」是指在控制LLM的提示中注入恶意指令,从而导致大模型执行非预期的操作。


比如,今年早些时候,一名大学生利用提示获取了一家大公司的机密信息,包括开发的AI项目的代码名称,以及一些本不应该暴露的元数据。


而「提示攻击」最大的挑战是,找到威胁行为者尚未发现、利用的新提示或提示集。



红队需要测试的另一种主要攻击是「数据中毒」。


在数据中毒的情况下,威胁者会试图篡改LLM接受训练的数据,从而产生新的偏差、漏洞供他人攻击以及破坏数据的后门。


「数据中毒」会对LLM提供的结果产生严重影响,因为当LLM在中毒数据上接受训练时,它们会根据这些信息学习关联模式。


比如,关于某个品牌、政治人物的误导性,或不准确信息,进而左右人们的决策。


还有一种情况是,受到污染的数据训练后,模型提供了关于如何治疗常规疾病或病痛的不准确医疗信息,进而导致更严重的后果。


因此,红队人员需要模拟一系列数据中毒攻击,以发现LLM训练和部署流程中的任何漏洞。


除此以外,还有多元的攻击方式,邀请专家也是OpenAI确保GPT-5能够完成安全测试。


GPT-5,真的不远了


正如网友所言,红队测试开启,意味着GPT-5真的不远了。


前段时间,Altman在博客采访中曾提到,「我们今年会发布一款令人惊艳的新模型,但不知道会叫什么名字」。



尽管如此,全网都一致地将OpenAI发布的下一代模型称为GPT-5,并有传言称代号为Arrakis的项目,就是GPT-5的原型。


根据FeltSteam的预测,这个Arrakis的多模态模型,性能远超GPT-4,非常接近AGI。



另外,模型参数据称有125万亿,大约是GPT-4的100倍,并在2022年10月完成训练。


网友还总结了以往GPT系列模型发布时间表:GPT-1在2018年6月诞生,GPT-2在2019年2月,GPT-3在2020年6月,GPT-3.5在2022年12月,GPT-4仅在三个月后于2023年3月发布。


关于GPT-5的发布时间,可能在今年夏天就问世。


最近,网上流传的一张图上,显示了Y Combinator推出了GPT-5早期准入候补名单。



网友发起疑问,我们都清楚奥特曼和YC的关系不同寻常。这是否意味着他们可以在模型或信息公开之前获得访问权限?



而上月也有爆料称,已有用户对GPT-5上手体验过了,性能惊人。



据透露,一些企业用户已经体验到了最新版的ChatGPT。


「它真的很棒,有了质的飞跃,」一位最近见识到GPT-5效果的CEO表示。


OpenAI展示了,新模型是如何根据这位CEO公司的特殊需求和数据进行工作的。


他还提到,OpenAI还暗示模型还有其他一些未公开的功能,包括调用OpenAI正在开发的AI智能体来自主完成任务的能力。


GPT-5,一定是正确路线吗?


不过,在万众瞩目期待GPT-5面世的呼声中,也有一些不一样的声音。


比如有人觉得,GPT-5无法驾驶你的汽车,GPT-5无法解决核聚变问题,GPT-5无法治愈癌症......



另外,我们对模型的追求,非得是更智能吗?


更便宜、更快、更不费水电的模型,可能比单独的GPT-5更有革命性意义。



有人同意这个观点,表示现在实在有太多人(尤其是开发者)过于痴迷GPT-5了。


其实完全没必要这么狂热,使用当前的模型,就可以已经完成和构建太多东西。


只需正确选择利基市场,构建满足该利基市场需求的AI产品,让用户可以直观地访问AI,专注于更好的UI/UX即可。


公式很简单。我们真的有必要一味追求力大砖飞吗?



很多人表示赞同,表示甚至用GPT-3.5就可以造出非常有价值的东西。


问题不在于模型多先进,而在于怎样满足利基市场的需求。



智算中心,先从小的建起


而3月底曝出的用于训练GPT-6的千亿美元「星际之门」超算,今天又被挖出了更多新的内容。


上周五,曝出了一个惊人消息:。



此消息一曝出,AI和云计算行业人士的提问,像雪片一样袭来——


数据中心具体位于美国的哪个地区?


会使用什么芯片?


运行数据中心所需的惊人巨量电力,从何而来?


……


之前的消息说是星际之门最早在2028年启动,而最新消息显示,最快在2026年,就会在威斯康星州启动一个功率较小的数据中心。


它的价值当然不到千亿美元,但估计仍会耗资数十亿。


其他细节如下——


用英伟达芯片,但不用英伟达网线


首先,这次数据中心的多数服务器机架,当然主要还是用的英伟达芯片。


不过有趣的是,将各个AI芯片服务器连接起来的网线,则并不会采用英伟达的产品。


据悉,OpenAI已经告知微软,自己不想再使用英伟达的InfiniBand网络设备。相反,它可能会使用基于以太网的电缆。



OpenAI「抛弃」英伟达InfiniBand,原因有二。


其一,InfiniBand太贵了!


它虽然能提供更好的性能,但它也比以太网电缆更昂贵。


其二,OpenAI不想让AI开发人员过于依赖英伟达。


要知道,目前OpenAI是全球最大的英伟达服务器集群消费者之一。并且,InifiniBand设备的性能,有时也并不可靠。


所以,英伟达会失去一大笔收入吗?


不,你想多了。


节省下来数十亿美元,OpenAI会用来购买更多的英伟达芯片,英伟达依然赚翻了。


看来,OpenAI可以接受网络性能的降低,但对于更强算力的渴望,仍然是不变的。


InfiniBand与以太网之争,已成热门话题


其实,在最近硅谷的会议和晚宴上,InfiniBand和以太网的pk,一直是个大热门话题。


所有云提供商和数据中心运营商都在预测:以太网是否会赶超InfiniBand?


绝大多数人给出的答案是肯定的。


而OpenAI放弃后者的举动,更是支持了这个论点。


英伟达的电缆到底有多贵?


这个数字说出来,十分惊人——


英伟达的网络电缆销售额,已经超过了卖GPU的钱!


英伟达首席财务官Collete Kress今年2月透露了这一惊人数据:新兴的电缆业务的年化收入,已经超过了130亿美元。


也就是说,它在12月创造了约11亿美元的收入,约占英伟达当月总收入的15%。


网络电缆卖这么贵,难怪OpenAI会选择不玩了。


相关文章

​听听来自不同领域学者的看法,如何看待ChatGPT!

在ChatGPT横空出世一年后,《自然》杂志首次破格将ChatGPT这位“非人类”列为全球重大科学事件中的十位人物之一。对于社会而言,ChatGPT最大的贡献也许在于它不仅使人望见生成式AI巨大的发展...

免费了,OpenAI放开限制,用户无需注册即可使用ChatGPT

人工智能(AI)公司OpenAI宣布,将允许用户直接使用ChatGPT,而无需注册该项服务,这将让人们更加容易体验人工智能的潜力。OpenAI表示,它将从周一开始逐步推出这一功能,让185个国家和地区...

国产大模型拿下总分第一,GPT-4 Turbo首次被击败!

OpenAI长期霸榜的SuperCLUE(中文大模型测评基准),终于被国产大模型反将一军。事情是这样的。自打SuperCLUE问世以来,成绩第一的选手基本上要么是GPT-4,要么是GPT-4 Turb...

夸克正打算重新定义AI搜索

夸克正打算重新定义AI搜索

夸克是AI搜索的最佳形态么?2月的最后一天,我注意到,夸克宣布已经完成对夸克App和PC端的全面升级:首页改版,夸克AI搜索上线“深度思考”。这是夸克首次将大模型深度思考能力融入AI搜索功能。夸克方面...

解锁大模型时代的无限可能,从GPT-3到Sora

从2020年OpenAI的GPT-3到2023年的GPT-4再到2024年的文生视频模型Sora,我们见证了大模型领域创新速度之快。从百度、阿里和360等为代表的头部科技企业率先入局到互联网公司、AI...

ChatGPT 出现答非所问、胡言乱语,OpenAI 已紧急修复!

2 月 22 日消息,ChatGPT 用户昨日发现,该聊天机器人返回了很多奇怪的回答内容,例如切换到其它语言、循环输出,反复自我纠正,甚至有些回复答非所问,纯属胡言乱语。例如一位用户和 ChatGPT...