考试能力超 90% 人类的 OpenAI GPT-4 发布 今日热闻
北京时间 3月15日消息,今天凌晨,OpenAI 最新版本的大型语言模型已经公布 ——GPT-4。该公司表示,GPT-4 在许多专业测试中,它表现出超过绝大多数人类的水平。
(相关资料图)
具体而言,GPT-4 实现了以下几个方面的飞跃式提升:更聪明,做题水平越来越好;支持图像输入,拥有强大的识图能力,但目前只限内部测试;更长的上下文,文字输入限制提升至 2.5 万字;回答准确性显著提高;更安全,有害信息更少。
对于普通人而言,如何理解 GPT-4 到底有多强多聪明?
据 OpenAI 透露,GPT-4 通过了所有基础考试而且是高分通过。例如,GPT-4 在模拟律师资格考试的成绩在考生中排名前 10% 左右,在 SAT 阅读考试中排名前 7% 左右,在 SAT 数学考试中排名前 11% 左右。相比之下,曾经令人震撼的 GPT-3.5 ,真实得分在倒数 10% 左右,GPT-4 的强大已经可想而知。
有网友评论,“如果真跟报告说的那样就太可怕了,我感觉能力已经远超我了。”也有人笑称,“我躺好了!我生在了适合我的时代!”
最多的声音则是对未来工作不保的担忧,“还有哪个行业可以不被替代?”“消除任何幻想,AI 时代横扫全球,先思考下 GPT-4 不能做但你能做的。”
比以前的版本“更大”,或许也更烧钱
OpenAI 称,GPT-4 比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。
同时,OpenAI 并未公布这个模型的参数量有多少。
OpenAI 表示,它使用的是微软 (MSFT.US) Azure 训练模型,微软已经向这家初创公司投资了数十亿美元。OpenAI 没有公布具体模型大小的细节,也没有公布用来训练模型的硬件,理由是“竞争情况”。
目前,此领域的许多研究人员认为,人工智能领域的许多最新进展,都来自于在数千台超级计算机上运行越来越大的模型,这些模型的训练过程可能耗资数千万美元。
为了不断提高 GPT-4 性能,OpenAI 还为其研发大搞“基建”。
在过去的两年里,OpenAI 重建了整个深度学习堆栈,并与 Azure 一起为其工作负载从头开始设计了一台超级计算机。一年前,OpenAI 在训练 GPT-3.5 时第一次尝试运行了该超算系统,之后他们又陆续发现并修复了一些错误,改进了其理论基础。这些改进的结果是 GPT-4 的训练运行获得了前所未有的稳定。
OpenAI 联合创始人兼总裁格雷格・布罗克曼(Greg Brockman)表示,OpenAI 预计,未来将由投资十亿美元超级计算机的公司开发尖端模型,一些最先进的工具将带有风险。OpenAI 希望对他们工作的某些部分保密,以给初创公司“一些喘息的空间,以真正关注安全并做好它。”
局限性明显,GPT-4 仍然不完全可靠
尽管功能已经非常强大,但 GPT-4 仍与早期的 GPT 模型具有相似的局限性,其中最重要的一点是它仍然不完全可靠,也就是还有可能胡说八道。
OpenAI 也警告称,GPT-4 还不完美,在许多情况下,它的能力不如人类。该公司表示:“GPT-4 仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”
总的来说,GPT-4 相对于以前的模型(经过多次迭代和改进)已经显著减轻了幻觉问题。在 OpenAI 的内部对抗性真实性评估中,GPT-4 的得分比最新的 GPT-3.5 模型高 40%。
同时,GPT-4 训练数据还是截止到 2021 年 9 月份。这也意味着,GPT-4 对于这个时间点以后的信息,缺乏足够的了解,也不会从其经验中学习。
在 GPT-4 发布之后,OpenAI 创始人阿尔特曼发推文表示:“它仍然是有缺陷的,仍然是有限的,在你花了更多的时间第一次使用它时,它似乎比实际情况更令人印象深刻。”
中国的 ChatGPT 们要怎么追?
最令人震惊的在于,按照 demo 视频里 OpenAI 工程师们的说法,GPT-4 的训练在去年 8 月就已经完成,剩下的时间都在进行微调提升,以及最重要的去除危险内容生成的工作。
这也意味着,OpenAI 内部技术,比大家想象中的领先外界更多年。更可怕的是,OpenAI 还一口气开放了 API 接口和相关论文!这让中国的 ChatGPT 们还怎么追?
英诺天使基金合伙人王晟曾告诉《态℃》栏目,“中国的 ChatGPT 们即便奋起直追,静态来讲也许两三年能追上,我认为已经很乐观了。”
但随着更强大的 GPT-4 发布,OpenAI 的技术能力显然仍在不断进步,且进展速度远比我们追的速度还要快。王晟在之前的采访中判断,“除非这件事突然遇到了一个瓶颈,整个科技发展方向到头了,对方不得不停下来,或许我们还有机会追平,或者我们挖掘到一种新的技术路径有机会追上,不然可能没有机会了。”
与此同时,在该模型的落地和应用方面,OpenAI 也有了最新进展。
新模型将提供给 ChatGPT 的付费用户,也将作为 API 的一部分提供,允许程序员将 AI 集成到他们的应用程序中。OpenAI 将对 750 字左右的指令信息收费 3 美分,对 750 字左右的响应信息收费 6 美分。
OpenAI 还介绍,摩根士丹利正在使用 GPT-4 来组织数据,而电子支付公司 Stripe 正在测试 GPT-4 是否有助于打击欺诈。其他客户还包括语言学习公司 Duolingo、Khan Academy 和冰岛政府。OpenAI 合作伙伴微软周二表示,新版必应搜索引擎将使用 GPT-4。
GPT-4 取得的成绩令人兴奋,但对于还在起跑线上的中国 ChatGPT 们,还有大量的工作要去探索和研究,想必感受到了巨大的压力。风浪越大鱼越贵,对于这些迅速进入这个新领域的公司来说,也将会拥有巨大的机会。
GPT-4 的强大告诫我们,未来唯一限制的因素,就是你的想象力!
关键词:
推荐阅读
飞机发明者是谁?飞机有哪些类型?
飞机发明者是谁?飞机是由莱特兄弟发明的,莱特兄弟是美国著名的发明家,他们的哥哥是威尔伯菜特,他们的弟弟是奥维尔莱特。1903年12月17日 【详细】
Google I/O线上开发者大会发布 安卓12新特性支持什么功能?
现在大多数人用的手机还是安卓机,本次Android 12的发布自然也是引起了一大波的关注,国内不少厂商也参与了测试,我们来看看谷歌正式发布A 【详细】
航天员出舱七个小时怎么喝水?太空行走的危险和好处是什么?
航天员出舱七个小时怎么喝水?7月4日,中国宇航员刘伯明和汤洪波出航活动,整个进程持续了7个多小时。据报道,宇航员在舱外服里有饮水袋,在 【详细】
NASA毅力号录下了来自火星的声音 毅力号录下了来自火星的声音怎么回事?
NASA毅力号录下了来自火星的声音近日,有报道称,NASA毅力号录下了来自火星的声音,这非常的奇妙,相信大家十分的感兴趣,下面一起去看看吧 【详细】
北京上空现三个太阳 古代幻日现象预兆什么?
北京上空现三个太阳北京上空现三个太阳 专家释疑今日登上热搜,主要是在12月29日有网友拍到北京上空出现了三个太阳。对于这一现象气象专家 【详细】
相关新闻
考试能力超 90% 人类的 OpenAI GPT-4 发布 今日热闻
今天凌晨,OpenAI最新版本的大型语言模型已经公布——GPT-4。该公司表示,GPT-4在许多专业测试中,它表现出超过绝大多数人类的水平。 具体而言 【详细】
特斯拉首批 V4 超级充电站将本月在欧洲推出_环球热点评
4超级充电站将于3每月在欧洲推出,网友@Fritsvanens在荷兰Harderwijk 拍到了首批V4超级充电站照片。据称,这些充电桩已经由特斯拉员工完成测试 【详细】
河南信阳:浉河区常态化核酸检测发现一例新冠感染者,市中心城区采取临时管控措施-每日热文
“信阳政务”微信公众号援引信阳市疫情防控指挥部办公室消息,2022年9月21日,浉河区在常态化核酸检测中发现一例无症状感 【详细】
【天天新要闻】美国硅谷银行关闭,影响蔓延至全球!腾盛博药、康龙化成回应
近日,美国硅谷银行因资不抵债在48小时内关闭后,由美国联邦存款保险公司接管。之后,美国财政部以存在系统性风险为由关闭美国标志银行。该银 【详细】
GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
OpenAI花了6个月的时间使用对抗性测试程序和ChatGPT的经验教训对GPT-4进行迭代调整,从而在真实性、可控性等方面取得 【详细】
视频配音不想用自己声音,能用ai画圈做配音吗?-世界今日讯
但是,现实中很多人并不喜欢听到自己的声音,甚至有一些人对自己的声音感到不适,因此使用AI画圈做配音成为了一种备选方案。 【详细】
GPT-4:我来了,我更强了!个性化写作,读图,帮你读文献…
如果说ChatGPT更像是个玩具的话,OpenAI的GPT-4则更像一个产品,他立刻可以帮你做一些“不那么简单”的工作,从而帮助你从一些不那么 【详细】
飞机发明者是谁?飞机有哪些类型?
飞机发明者是谁?飞机是由莱特兄弟发明的,莱特兄弟是美国著名的发明家,他们的哥哥是威尔伯菜特,他们的弟弟是奥维尔莱特。1903年12月17日 【详细】
misswhite(miss white的中文意思是什么?)|今日播报
很多小伙伴想了解misswhite的相关知识,今天小编专门整理了misswhite的内容介绍,让我们一起看看吧。本文目录一览:1、misswhite翻译成中文名 【详细】
拼多多新用户(如何成为拼多多新用户)_即时焦点
很多小伙伴想了解拼多多新用户的相关知识,今天小编专门整理了拼多多新用户的内容介绍,让我们一起看看吧。本文目录一览:1、拼多多怎么注册新 【详细】
苹果发布第三财季财报 苹果净利润下降的具体原因是什么?
苹果发布第三财季财报最新消息,7月29日凌晨,苹果公司发布2022财年第三财季业绩。报告显示,苹果公司第三财季净营收为829 59亿美元,同比 【详细】
中国天眼已发现240余颗脉冲星 找脉冲星有什么用?
中国天眼已发现240余颗脉冲星自今年1月验收以来,中国天眼的设施运行稳定可靠。在过去的一年中,观察到超过5200个服务小时,这几乎是预期设 【详细】
【新视野】GPT-4发布!ChatGPT大升级!太太太太强了!
金磊梦晨发自凹非寺量子位|公众号QbitAI一觉醒来,万众期待的GPT-4,它来了!OpenAI老板SamAltman直接开门见山 【详细】
今日观点!949元起!6000mAh大电池+LCD屏,这台手机卷疯了
iQOOZ7系列的Slogan是「性能续航小超人」,对标Redmi的小金刚了属于是。Z7搭载5000mAh电池+120W快充 【详细】
环球热推荐:智慧园区数字化平台、工业云平台、智能工厂总体规划与建设方案
主要建设内容:智慧园区数字化平台总体规划、智慧园区工业云平台建设方案、园区智慧办公平台建设方案、园区智能工厂建设解决方案、园区智慧能源 【详细】
言的部首(言字的部首是什么?)_速看料
很多小伙伴想了解言的部首的相关知识,今天小编专门整理了言的部首的内容介绍,让我们一起看看吧。本文目录一览:1、言字的部首是什么?2、“言 【详细】
世界报道:lovelycation2(LOVELY×CATION2的人物介绍)
很多小伙伴想了解lovelycation2的相关知识,今天小编专门整理了lovelycation2的内容介绍,让我们一起看看吧。本文目录一览:1、LOVELY×CATION 【详细】
世界的边界线到底在哪里 世界实际上是有界限的但是没有边是为什么?
虽说人类一直以来对于众多的世界都十分的猎奇,但是,因为人类在世界中的存在,实在太过于藐小,甚至连海洋中的一滴水都比不上,所以当人类 【详细】
Google I/O线上开发者大会发布 安卓12新特性支持什么功能?
现在大多数人用的手机还是安卓机,本次Android 12的发布自然也是引起了一大波的关注,国内不少厂商也参与了测试,我们来看看谷歌正式发布A 【详细】
iPhone14Pro古铜配色曝光 iPhone14还有哪些其他的颜色?
iPhone14Pro古铜配色曝光iPhone14系列手机就快要面世,根据最新消息,9月全新的iPhone 14系列此次可能还将新增一款古铜色配色。iPhone14还 【详细】