先来看一组震撼人心的考试成绩
美国律师资格考试298分通过,超过90%考生
SAT1410分,这还是数学只拿到700的前提下
AP艺术史、生物、微观宏观经济学、心理学、统计、美国历史等考试中全部顺利拿到5分
当你以为这是哪位优秀毕业生的成绩时,OpenAI公司告诉你,这只是GPT-4能力的冰山一角!美国当地时间3月14日中午,OpenAI官宣最新的GPT-4已经到来。
部分Plus用户已获得使用权限,同时API申请通道也已经开启。在很多人还在学习ChatGPT3.5的时候,GPT-4就这么横空出世,惊掉众人下巴。那么,它到底有哪些新的超能力呢?
01GPT-4的最新特性
OpenAI发布的最新语言模型GPT-4,是目前最大的语言模型之一,拥有约1.5万亿个参数,比前一版本GPT-3大了近10倍(1750亿参数)!GPT-4最大的特点是其多模态能力,能够同时处理文本和图像,并在两种媒体之间进行转换和协调。
这意味着它不仅可以生成文本,还可以生成图像,或根据文本生成图像,或根据图像生成文本。这种能力让GPT-4可以应用于许多场景中,如小说、漫画、音乐、电影等。
GPT-4的图片理解能力令人震惊
在一些专业和学术的基准测试中,GPT-4表现出了明显超过GPT-3.5的水平
以MMLU为例子。MMLU旨在通过在零样本和少样本的情况下评估模型,来衡量模型在预训练过程中获取的知识。这使得MMLU测试更具挑战性,也更接近于评估人类的方式。
MMLU测试包含了57个主题的14000个多项选择题2,涵盖了自然科学、社会科学、艺术、人文等领域。MMLU测试还支持多种语言,可以用来评估模型的跨语言能力。那么GPT-4的表现如何?
简而言之,GPT-4的得分远远超过前辈GPT-3.5的表现,顺便暴打了GOOGLE旗下的PaLM模型,并且GPT-4在多语言场景下都有不俗的表现。在OpenAI Playground网站上,用户可以与GPT-4进行交互,并选择不同的模式和主题生成文本或图像。此外,还有GPT-4 News、GPT-4 Art、GPT-4 Code、GPT-4 Chat等其他应用和演示。
02ChatGPT还有没有竞争对手?
就像是约好了一样,目前市面上最有潜力的2位竞争者——PaLM和Claude也在美国时间3月14日发布了重磅更新:
- Anthropic公司正式发布Claude,是目前最直接的ChatGPT竞争对手
- 谷歌旗下的PaLM也在当天正式宣布,开放PaLM的API权限,用于商业和开发用途。截止发稿前还没有公布具体定价
Claude是Anthropic发布的人工智能聊天机器人。在市场应用方面,Claude展现出了惊人的潜力,已经被Quora、Juni Learning、Notion、DuckDuckGo和Robin AI等公司使用,以提供各种服务,比如聊天、辅导、生产力、助手和法律合同评估。Calude的正式公布,意味着Anthropic正式进入下场跟OpenAI拼刺刀的环节。而有趣的是,组建Anthropic最早的元老成员,正是20年底从OpenAI离职的多位核心成员。相比热火朝天的ChatGPT和明星模型Claude,知道PaLM的人并不多。
但在大语言模型这个领域里,PaLM同样鼎鼎大名。PaLM是Google发布的一种大型语言模型,最大特点是它的双向能力,也就是它可以根据上下文来生成任意位置的文本,并且可以对文本进行编辑和修改。这意味着PaLM不仅可以生成文本,还可以改写文本,或者根据用户的要求来增加或删除文本中的某些部分。
这种能力让PaLM可以应用在很多场景中,比如创作文章、诗歌、歌词等。 另外,还有百度即将推出的文心一言大语言模型,将在3月16日(也就是本文发布的当天)举行发布会,表现也十分令人期待!
03用GPT-4可以玩出了哪些花样?
除了前面提到的鸡块地图,在过去的12小时里,网友们疯狂展示着对GPT-4的训练成果。
我能说很多人类都不见得能准确解释槽点么
网友:下一步直接用片子+GPT-4来进行医学诊断?
再加上具体的食谱,拍张照就能变成厨神?!
在官方演示视频中,主讲人通过一张手画的网页草图,就让GPT-4生成了相应的HTML代码,这可比上一代用自然语言处理需求更加令人惊讶,说明GPT-4的图片识别能力已经相当完善。
GPT-4到底还有多少潜力?GPT-5又将什么时候到来?而ChatGPT的竞争对手们面对来势汹汹的GPT,将会如何继续出招?让我们拭目以待,一起体验真正意义上的“日新月异”!