GPT-4 AP考试5分 SAT 1410分通过美国律师资格测试！

先来看一组震撼人心的考试成绩

颤抖吧！GPT-4有多强：AP考试5分，SAT 1410分，通过美国律师资格测试！

美国律师资格考试298分通过，超过90%考生

SAT1410分，这还是数学只拿到700的前提下

AP艺术史、生物、微观宏观经济学、心理学、统计、美国历史等考试中全部顺利拿到5分

当你以为这是哪位优秀毕业生的成绩时，OpenAI公司告诉你，这只是GPT-4能力的冰山一角！美国当地时间3月14日中午，OpenAI官宣最新的GPT-4已经到来。

部分Plus用户已获得使用权限，同时API申请通道也已经开启。在很多人还在学习ChatGPT3.5的时候，GPT-4就这么横空出世，惊掉众人下巴。那么，它到底有哪些新的超能力呢？

01GPT-4的最新特性

OpenAI发布的最新语言模型GPT-4，是目前最大的语言模型之一，拥有约1.5万亿个参数，比前一版本GPT-3大了近10倍（1750亿参数）！GPT-4最大的特点是其多模态能力，能够同时处理文本和图像，并在两种媒体之间进行转换和协调。

这意味着它不仅可以生成文本，还可以生成图像，或根据文本生成图像，或根据图像生成文本。这种能力让GPT-4可以应用于许多场景中，如小说、漫画、音乐、电影等。

颤抖吧！GPT-4有多强：AP考试5分，SAT 1410分，通过美国律师资格测试！

GPT-4的图片理解能力令人震惊

在一些专业和学术的基准测试中，GPT-4表现出了明显超过GPT-3.5的水平

颤抖吧！GPT-4有多强：AP考试5分，SAT 1410分，通过美国律师资格测试！

以MMLU为例子。MMLU旨在通过在零样本和少样本的情况下评估模型，来衡量模型在预训练过程中获取的知识。这使得MMLU测试更具挑战性，也更接近于评估人类的方式。

MMLU测试包含了57个主题的14000个多项选择题2，涵盖了自然科学、社会科学、艺术、人文等领域。MMLU测试还支持多种语言，可以用来评估模型的跨语言能力。那么GPT-4的表现如何？

颤抖吧！GPT-4有多强：AP考试5分，SAT 1410分，通过美国律师资格测试！

简而言之，GPT-4的得分远远超过前辈GPT-3.5的表现，顺便暴打了GOOGLE旗下的PaLM模型，并且GPT-4在多语言场景下都有不俗的表现。在OpenAI Playground网站上，用户可以与GPT-4进行交互，并选择不同的模式和主题生成文本或图像。此外，还有GPT-4 News、GPT-4 Art、GPT-4 Code、GPT-4 Chat等其他应用和演示。

02ChatGPT还有没有竞争对手？

就像是约好了一样，目前市面上最有潜力的2位竞争者——PaLM和Claude也在美国时间3月14日发布了重磅更新：

Anthropic公司正式发布Claude，是目前最直接的ChatGPT竞争对手
谷歌旗下的PaLM也在当天正式宣布，开放PaLM的API权限，用于商业和开发用途。截止发稿前还没有公布具体定价

Claude是Anthropic发布的人工智能聊天机器人。在市场应用方面，Claude展现出了惊人的潜力，已经被Quora、Juni Learning、Notion、DuckDuckGo和Robin AI等公司使用，以提供各种服务，比如聊天、辅导、生产力、助手和法律合同评估。Calude的正式公布，意味着Anthropic正式进入下场跟OpenAI拼刺刀的环节。而有趣的是，组建Anthropic最早的元老成员，正是20年底从OpenAI离职的多位核心成员。相比热火朝天的ChatGPT和明星模型Claude，知道PaLM的人并不多。

但在大语言模型这个领域里，PaLM同样鼎鼎大名。PaLM是Google发布的一种大型语言模型，最大特点是它的双向能力，也就是它可以根据上下文来生成任意位置的文本，并且可以对文本进行编辑和修改。这意味着PaLM不仅可以生成文本，还可以改写文本，或者根据用户的要求来增加或删除文本中的某些部分。

这种能力让PaLM可以应用在很多场景中，比如创作文章、诗歌、歌词等。另外，还有百度即将推出的文心一言大语言模型，将在3月16日（也就是本文发布的当天）举行发布会，表现也十分令人期待！

03用GPT-4可以玩出了哪些花样？

除了前面提到的鸡块地图，在过去的12小时里，网友们疯狂展示着对GPT-4的训练成果。

颤抖吧！GPT-4有多强：AP考试5分，SAT 1410分，通过美国律师资格测试！