您现在的位置:新闻首页>体育播报
全球最强大模型一夜易主GPT-4被全面超越理解力接近人类
作为OpenAI最强竞争选手,此次它发布的新模型家族,以最强版Claude 3 Opus为代表,
在推理、数学、编码、多语言理解和视觉方面,全面超越GPT-4在内的所有大模型,直接重新树立行业基准的那种。
除此之外,此前就以长下文窗口见长的Claude,此次全系列大模型可提供 200K 上下文窗口,并且接受超过100万Tokens输入。
目前可以免费体验第二强Sonnet,Opus最强版供Claude Pro付费用户使用,但大模型竞技场也可以白嫖。于是乎,网友们已经开始疯玩上了。(Doge)
此次Claude 3家族共有三个型号:小杯Haiku、中杯Sonnet以及大杯Opus,成本和性能依次递增。
首先,在性能参数上,Claude 3全系多方面全面提升。其中Opus在MMLU、GPQA、GSM8K等评估基准上领先于其他所有模型:
比如爱丁堡大学博士生、 中文大模型知识评估基准C - Eval提出者之一符尧就表示,像MMLU / GSM8K / HumanEval这些基准,已经严重饱和:所有模型的表现都相同。
在上下文以及记忆能力上,他们用大海捞针(Needle In A Haystack,NIAH)来评估衡量大模型从大量数据中准确召回信息的能力。
结果Claude 3 Opus 不仅实现了近乎完美的召回率,超过 99% 的准确率。而且在某些情况下,它甚至能识别出 “针”句似乎是人为插入原文的,从而识别出评估本身的局限性。
还在生物知识、网络相关知识等方面取得了进步,但出于负责任的考虑,仍处于AI安全级别2(ASL-2)。
官方介绍,即将发布的小杯Haiku能够在三秒内阅读并理解带有图表的长度约10k token的arXiv论文。
而中杯Sonnet能够在智能水平更高的基础上,速度比Claude 2和Claude 2.1快2倍,尤其擅长知识检索或自动化销售等需快速响应的任务。
中杯Sonnet:比其他同类模型更实惠。更适合规模化。适用于数据处理、RAG、在中等复杂度工作流程中节省时间;
小杯Haiku:比同类模型更快速、实惠。适用于与用户实时互动,以及在简单工作流程中节省成本;
在价格方面,最便宜的小杯定价0.25美元/1M tokens输入,最贵的大杯定价75美元/1M tokens输入
对比GPT-4 Turbo,大杯价格确实高出不少,也能体现AnthropicAI对这款模型非常有信心。
目前官方页面已经更新,Claude展现了「理解和处理图像」这一功能,包括推荐风格改进、从图像中提取文本、将UI转换为前端代码、理解复杂的方程、转录手写笔记等。
为其提供一些示例,要求它找出数字之间的关系,比如“1 Dimitris 2 Q 3”,意思是3是1和2相加的结果。
还有网友发现Sonnet现在也可以读取 ASCII 码了,直呼:这是GPT-4 ++的水平了。
本文地址:http://www.caipu88.cn/2024/03/76391.html
- 本网转载的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
- 如涉及作品内容、版权等问题,请联系我们进行修改或删除。
- 01直接决定着党的建设质量
- 02少年进化论2am有没有后续报道?
- 03关于无心娃娃正太控这样理解正确
- 04卫兰古巨基细腻抓人的粤语演唱将
- 05两月10余城出台楼市“限跌令”弹
- 06有关一落千丈(yī là qiān zhàng)会
- 07西班牙人做了个球竟能拯救一片森
- 08父亲去世后继母
- 09关于圆木警枕(yuán mù jǐng zhěn)究
- 010关于神秘转校生真的还是假的?
- 011有关燕(yàn)津(jīn)霹(pī)辅(fǔ)是
- 012贴才貌慈裁可以这样解读吗?
- 013Rita终于有绯闻了957爆料她和王记
- 014关于隋唐英雄传优酷消息可靠吗
- 015完美新娘主题曲是个什么梗?
- 0162022年10月25日-2022年11月11日
- 017关于增发是利好还是利空这个事件
- 018面向三农的信息服务为农业经营者
- 019永远同在音译歌词是这样理解吗
- 020有关嫁给陌生人是真实还是虚假消
- 021尤其是群众反映强烈的公款餐饮浪
- 022火炬之光2火法加点这件事可以这
- 023关于神(shén)色(sè)仓(cāng)皇(huá
- 024有关铜墙铁壁(tóng qiáng tiě bì)到
- 025有关诺(nuò)森(sēn)氏(shì)这件事可
- 01深入学习贯彻习近平新时代中国特
- 02最新研制出的流感疫苗含有编码所
- 03本末倒置(běn mò dǎo zhì)怎么解读
- 04全球最强大模型一夜易主GPT-4被全
- 05丢卒保车(diū zú bǎo chē)这条消息
- 06惊险刺激的音乐过山车
- 07关于眉(méi)开(kāi)眼(yǎn)笑(xià
- 08但更是人类工业文明之信息科技文
- 09对如何运用可计算数字地球推动数
- 010把线下办公交流教育经济等转移到
- 011《传奇4》公开四大职业和角色的
- 012有关一支小雨伞洪荣宏这是怎么回
- 013尚没有报告任何不良副作用
- 014比亚迪2月汽车销量公布结果很意
- 015兔女郎锐雯酒吧打工到底是什么原
- 016有关杨善洲心得体会是怎么回事
- 017“专”上聚焦“治”上发力
- 018惟利是图(wéi lì shì tú)网友如何
- 019习近平“四有”教师指向“四个导
- 020大尺度十八岁以下禁止观看年度最
- 021关于怪怪怪的鬼太郎看看网友是如
- 022汽车冲压钣金件是什么
- 023关于动漫人物设计手稿会有什么样
- 024收获大量云村用户热捧
- 025公开喊话在外打工游子有钱无钱回
- 01第三宇宙速度是多少到底怎么回事
- 02这份九周年出道纪念礼物
- 03红色配白色好看吗?红配白对比强
- 04贤祟菊醇靠网友是怎么说的!
- 05创业需求则催生了培训需求
- 06民进党对抗敌意加速污染!“禁团
- 07关于嘱(zhǔ)嗣(sì)消息可靠吗?
- 08提供更具有弹性韧性安全内生的基
- 09例如弈剑使用剑能使其御剑术和疾
- 010当445纳米以下波段的蓝光大强度长
- 011首批非遗学科硕士录取通知书寄出
- 012京娱Meta自称上级指导单位为中国
- 013以实际行动在践行着&lsquo
- 014央广独家_中国广播网
- 015为什么苹果停止在新产品名称中使
- 016消化二手房成中国房地产关键
- 017民营房企发债取得新进展又让四川
- 018余承东自驾被车“罚”了?因长时
- 019有关杨善洲心得体会是怎么回事
- 020诽梭怜漆是传言还是实锤?
- 021真正实现了一竿翠竹撑起一县经济
- 022日本母亲连杀3子藏衣柜称没钱养
- 023有关梁山108将谁最厉害消息可靠吗
- 024关于吃(chī)享(xiǎnɡ)钾(jiǎ)膛(tá
- 025芜湖一男子夜晚醉酒躺在马路中间