ChatGPT的热度还未散去,当地时间3月14日,开发商OpenAI发布了一款更为强大的产品——GPT-4。
为什么说GPT-4比以往的版本更为强大?
简单来说,就是因为它是真正的多模态模型,意味着可以使用多种模态的数据,不只是文字。
GPT-4是从之前被认为“拥有9岁小孩心智”的GPT-3.5迭代而来,火爆全网的ChatGPT也是基于GPT-3.5架构开发的对话AI模型。
据OpenAI介绍,“尽管远非完美,但我们利用ChatGPT带来的经验教训,以及对抗性测试调整优化了GPT-4。目前为止,GPT-4的真实性、可操控性和合规性达到有史以来最好的水平。”
能读图的GPT-4
和GPT-3.5相比,GPT-4如今可以接收文字和图像。
从OpenAI总裁和联合创始人Greg Brockman的直播演示中可以看到,GPT-4可以利用一张手绘的草图,做出对应的网站。
发送给GPT-4一张图片,并问它“我能用这些做什么吃的?”它也能对答如流。给它一张梗图,它也能迅速指出好笑之处等等功能充分展示了它的读图能力。
这项功能还被用于实处,开发商OpenAI和盲人辅助软件Be My Eyes达成合作,不用再依赖于人类志愿者,盲人们可以在拍下照片后,依靠GPT-4的描述了解面前的东西是什么,外表如何。
GRE、SAT成绩也不错
在许多现实世界场景内,GPT-4还不及人类,但是在各种专业和学术方面,它已经能有超过人类平均水平的表现。
OpenAI的官网放出了一张GPT-4、GPT-3.5参加过考试的成绩表。
可以看出,GPT-4比GPT-3.5的分数有所提升,SAT满分800能拿到710分,数学能拿到700分,GRE也接近满分。
结合上文的读图能力,GPT-4甚至可以阅读论文,并针对用户指定的论文内图片进行解释并总结,直接给出论文摘要和要点。
更强的记忆力和语言能力
在语言方面,GPT-4也相比以前的模型有了大幅提升,在测试的26种语言中,GPT-4在24种语言上的表现均优于GPT-3.5和其他模型,其中中文达到了80.1%的准确性,比GPT-3.5的英文准确性提升了10%。
除此之外,GPT-4 的长度限制提升到32K tokens,能处理超过 25000个单词的文本,并且可以使用长格式内容创建、扩展对话、文档搜索和分析等。
GPT-4还被加上了“角色扮演”功能,在人们设定好它的人设,规范它的行为特征后,它所输出的内容都将符合既定的人设。
目前为止,和ChatGPT不同,GPT-4对外付费开放,需每月支付20美元的订阅费,但即使采用付费模式,排队申请使用的人仍络绎不绝。
有业内人士预测,在GPT-4的带动下,未来大模型以及多模态模型的商业化应用将进一步加速,带动行业景气度持续向上。但从各界群体的反馈中可以看出,在赞叹于飞速发展的AI技术的同时,人们对AI的监管和道德问题提出了质疑。欧盟委员会也于近期表示,将针对风险最高的人工智能出台法案。
随着ChatGPT走入人们视野,有不少人对未来的职业前景也表示担忧。