ChatGPT优势和使用局限性分析

作者:甄科学

转载:秦朔朋友圈

ID:qspyq2015

ChatGPT于去年11月30日发布,我就开始试用了,写过几篇小文章。那时在海外和业内人圈子里,火了一波,国内大部分人都没反应。

春季后,券商报告强推,微软百亿投资openAI,百度紧跟形势不掉队,国内爆炒ChatGPT的热度甚至超过国外,大超预期。

然而,ChatGPT不开放来自中国地区IP和手机号码的用户注册,大部分人没有真正用过。有人用国外账号架设了中继服务器,给国内朋友使用。受条件所限,大部分使用者浅尝辄止、看热闹的多。有些文章甚至存在夸大ChatGPT能力的情况。

所以,我想用我这两个月的使用心得,聊聊科学使用ChatGPT和不科学使用ChatGPT的地方。

这些科学和不科学的地方,也反映了大家对ChatGPT在具体应用场景中的科学性的思考。

01

先说不科学的地方。

1、当搜索引擎用

由于谷歌和百度入局,很多人讨论将来搜索引擎会被替代。所以有人很自然地,现在就把ChatGPT当搜索引擎来使用和测试。

这个问题很大!

如果输入“如何做鱼香肉丝”这个问题,搜索引擎找到已经存在于互联网上的做法,并把结果排序。而ChatGPT给出的是看起来像“做法”的一段文字。这段文字不是从一个完整的做菜秘籍来的,而是它的算法根据每个字的概率和上下文,一个字一个词产生的。你貌似看到了一个完整的做法,但这个做法从来没有存在过,也没有人用过。

ChatGPT只是造了一段做菜的文字。要理解这一点,需要回到ChatGPT的模型。

ChatGPT模型综合使用了in-context learning、RLHF等模型。此处不展开技术部分的讨论。其中一部分模型是用类似我们英语考试最熟悉的、完形填空的方法来训练的。

比如一道完形填空题:我喜欢___的感觉。

空格里,可以填成我喜欢跑步的感觉,可以填成我喜欢炒菜的感觉,也可以填我喜欢发呆的感觉。填什么取决于对话场景。

如果填成我喜欢被杀死的感觉,这种场景出现的概率很低。算法会降低“我喜欢”后面跟“被杀死”三个字的概率。

如果填成我喜欢桌子的感觉,就是完全错误的答案,算法给“桌子”的概率是零。

基于很多类似这样的题目,让机器做题,再纠正对错,就可以训练出算法。

所以,ChatGPT是文字编码和概率组合的游戏,不是准确的事实信息。

搜索引擎最大的难度是找到最相关的准确信息。现在ChatGPT还当不了搜索引擎。将来它会是搜索引擎的好帮手,可以把搜索引擎的准确结果,组合得更易读。

想象一个“搜索引擎+ChatGPT”的场景:基于搜索引擎的准确信息,ChatGPT组合出一篇结构严谨、文字优美的文章。不用你把每个搜索页面打开、拷贝、组织、粘贴了。

2、当专家用

我曾经试过问ChatGPT:如果中国经济想在2023年重新回到较高的增长速度,需要解决什么问题,你有什么建议?

它回答:对于中国经济重新回到较高的增长速度,我有以下建议:1. 重点加强消费需求;2. 加强改革和创新;3. 完善金融体系;4. 加强社会投资;5. 健全科技体系。

这些回答看起来头头是道,确实和专家说的一样,并且还有新颖的地方。这是因为,当问这个问题的时候,模型训练过的大部分文本中,涉及经济增速的那些话,都是专业人士说的。在专业的语境里,出来的语言就是专家的语言,不会是老百姓的回答:增速高低管我啥事,有人给我发工资就行。

所以,不能信ChatGPT说的话,不能把它当专家。但是这些话可以给你启发,你自己可以想这五条建议对不对

3、想一次得到想要的结果

ChatGPT这个名字,Chat部分,会给人一些误导。

一般来说,我们和人交流,不会重复问对方同一个问题;正常人不会每次对同一个问题,给出不一样的答案。人的思想是一致的,说出来的话是一致的。一言九鼎,人不能瞎说。

ChatGPT不一样,不能把它当成人。如果问了一个问题,觉得它回答得不好,你可以重复问同样的问题,直到得到满意的答案。ChatGPT算法的随机性,让它每次给出的答案都不一样,会有完全相反的观点。

ChatGPT模型有个参数,叫temperature。如果temperature是0,它不说不靠谱的话,在是与否、答案唯一的问题上,它不胡说。不知道的,它说不知道。如果temperature大于零,它说的是有一定概率相关的话,每次说的不一样。

我把temperature参数叫做胡说参数。胡说参数值越高,越天马行空,直到语言都对,但张冠李戴、事实完全错误。就像生活中偶尔碰到的正儿八经的胡说八道的人一样。

我看到有的朋友试用ChatGPT,问了开放性问题,看一眼回答后,觉得答案没意思,就认为ChatGPT没意思,不再用了。这样体会不到ChatGPT的妙处。要得到有趣的结果,要不停地问它,就会有惊喜。

再比如,同样的问题,可以设定文字的语气。比如,我让ChatGPT礼貌地提醒别人请戴口罩,它的回答是:

“请您注意戴口罩,以保护您和他人的健康。”

如果让它言辞激烈地提醒别人戴口罩,结果是这样的:

"不戴口罩,你就是在自寻死路!"

完全不一样。

这是ChatGPT强大的地方,会产生非常有用的应用场景。

02

下面说几个科学的方面,也就是ChatGPT适合的、现在就可以派上用处的地方。

1、万能提纲

在讨论“不科学”的部分,我们认识到了ChatGPT照猫画虎、生产出像虎的文字。当把逻辑严谨、考虑全面的科学论文数据训练后,ChatGPT从“表面上”获得了最强的逻辑和最全面的思维,于是它非常适合针对一个研究主题,分解研究这个问题的各个方面,列出研究提纲或模板。

比如,我要写一篇题目是《怎么帮助男人走出中年危机》的论文,或者朋友中年焦虑了,你想帮助开导朋友,从哪些方面着手、怎么谈,ChatGPT可以迅速列出提纲:

一、中年危机的定义(1. 什么是中年危机;2. 中年危机的主要表现;3. 中年危机的原因)

二、帮助男人走出中年危机的方法(1. 充实自我:增强自信,拓展兴趣;2. 加强联系:和家人、朋友、同事保持良好的沟通;3. 改变生活:改变工作状态,改善生活习惯)

三、男人走出中年危机的心理护理(1. 正确认识中年危机;2. 找到自我实现的方式;3. 找到自我调节的方法)

四、社会环境对男人走出中年危机的影响(1. 家庭环境;2. 工作环境;3. 社会环境)

同时,它可以告诉你一些克服中年危机的最新研究结论和方法:

男性中年危机的主要原因是职业发展和家庭压力。因此,帮助男性走出中年危机的最佳方法是提高他们的职业发展能力和家庭技能,以减少他们承受的压力。参加社交活动、培养良好的心理状态和调节情绪,以及找到自己的爱好,可以有效帮助男性走出中年危机。通过健康的生活方式和良好的睡眠习惯,可以帮助男性改善心理和生理状态,从而缓解中年危机。

ChatGPT生成的这些完整的方面和观点,并不是谁都可以简单想到。

或者,如果想知道如何评估一家上市公司的投资价值,ChatGPT可以完整地列出考虑的因素:

一、财务指标(1、财务报表:分析公司的资产负债表、利润表和现金流量表,比较公司的收入、利润和财务状况,及其与行业公司的比较分析。;2、财务比率:研究公司的资产收益率、现金流量比率、存货周转率、固定资产折旧率等指标,反映公司的财务状况;3、财务风险:分析公司的财务风险,包括短期偿债能力、流动性、抵押贷款,研究公司的负债状况,以及公司与行业比较)

二、市场表现(1、股票价格:研究股票的历史价格走势,及其与行业公司的比较分析;2、股票流动性:研究股票的流通性,观察股票的换手率、成交量、收益率等,以及公司与行业比较;3、股息政策:分析公司的股息政策,包括股息支付水平等)

此处是微软看好ChatGPT的原因。知识工作者即使学过这些知识,但已经大部分还给了老师,在1分钟内想不到如此全面。即使想到了,还得一个字一个字敲出来,对吧?ChatGPT不用敲键盘了,自动生成各种提纲供选择、优化。极大地提升效率。

ChatGPT的训练模型经过专业论文库的训练,它把问题分解出的层面非常全面、深入。提纲对仗工整、非常漂亮。写过论文、发言稿、研究报告的人,知道此处的价值。

2、文字改写

不同语境需要不同的语言风格。文字工作者在写文章的时候,如果想把文字写得更精致,更优美,或更通俗,ChatGPT可以改写成作者想要的写作风格。

比如,上文这段话,风格偏正式,我想改得更轻松一点。ChatGPT可以改成:

不同的场景需要不同的语言风格,ChatGPT就像一个魔法棒,能够帮助文字工作者把文字写得更炫酷,更棒棒哒,或更容易懂!

不同场景,需要不同的语言搭配。文字工作者在写文章的时候,如果想把文字写得更精彩,更优雅,或更易懂,ChatGPT就是你的福音,能帮助你把文字写得更符合你的写作风格。

或者,我想改成更文绉绉的古文范儿,ChatGPT会改成:

文人文章,若欲精致,美轮美奂,或浅显易懂,

ChatGPT可以协助作者,以至于达到所欲之文韵。(文韵这个词似乎用得很好。)

3、细节优化

我不是专业作家,写不好描写场景的文章。我可以让ChatGPT帮我写细节。比如,描写一朵迎春花:

这朵美丽的迎春花,鲜艳的花瓣像一片绚烂的绣线,把春天的热情洋溢出来;

灿烂的花蕊,像一颗颗闪耀的星星,传递着春天的温暖;

清新的花香,像一阵清风,把春天的活力拂拭而来。

它就像一个美丽的小仙子,把春天的美丽和温暖带给每一个人。

这极大地提升了效率。小说家们只要把精力放在构思情节上,而不需要花时间在润色文字上。

那么,ChatGPT的文字能不能带感情呢?上面迎春花的文字是带着美好的感情,我可以让ChatGPT写伤感的感情:

这朵迎春花,娇艳欲滴,似乎在悲伤地轻叹着什么。

它的瓣片,如同刚刚落泪的眼眶,湿润而又柔软;

它的花蕊,如同曾经深情相拥的双手,无奈而又温柔。

它的芳香,似乎在悄悄诉说着什么,却又无人可以听见。

它的美丽,既是一种悲伤,又是一种温柔。

有些描写像中学生的作文。虽不错,但稍感幼稚。ChatGPT更厉害的在于还有个性化训练模型,可以训练出一个人的语言风格,此后写的文字就都是类似的语言风格了。

我在之前的文章中,写了生成任意风格艺术家的画作,ChatGPT也可能达到生成任意作家的写作风格。

此处就产生了知识产权问题。国外有很多反对AI生成作品的组织。ChatGPT也非常谨慎地开放所服务的国家和地区,因为每个地方的法律不同,不加控制地应用,可能会产生知识产权纠纷。

4、代码助手

编程程序也是语言。把自然语言转化为程序语言,也是ChatGPT可以用武的地方。由于这块的受众以程序员为主,我不展开。

此处的问题还聚焦在准确性上。写代码耗费最多时间的是找bug。如果准确性不够,写出来的代码bug太多,还不如自己写。如果要用好这个功能,对使用者的要求比较高,需要清晰的语言把代码的目的描述出来。这样,ChatGPT才可能准确地把自然语言“翻译”成代码语言。

在未来,码农的工作将更多走向理解需求、架构、算法,而不是写代码这个过程上。

5、启发灵感

文字工作者最痛苦的是写不出东西。写不出东西的时候,有两种情况,一种是肚里没货,一种是不知道从何下笔。有了AI,它可以给你很多东西,让你挑选。

本来以为人工智能只能替代机械的工作,实际却是AI可以用随机性创造出无数可能的东西。创新就是跨界、组合、异想天开。AI可以随机地生成很多东西,在里面淘金,可以挖到很好的灵感。

如果涉及事实之间的组合,需要你自己判断其事实的基础是否准确。AI擅长一本正经地胡说八道,所以,人需要比AI更强,才用得好AI。如同领导一定要有辨识下属说的话的能力,才能做好事情一样,AI对人类提出了更高的要求。

有人用ChatGPT写了书、论文,有人用ChatGPT只能寒暄几句聊天。使用ChatGPT需要技巧。就像有人把PPT做成电影大片,有人把PPT做成Word都不如。当中的区别还是人怎么用。

1950年代以前,识字的人就是人才,现在识字这个技能已经不算技能了。AI的发展如同消灭文盲一样,让某些技能普惠大众,不再成为一些人的独有技能。

最后总结一下,AI的“不科学”在于,要避免它的“不科学”滥用,一旦互联网充斥AI产生的不准确信息,互联网就被毁了——AI自己毁了自己。提高准确性是ChatGPT的竞品和ChatGPT自己未来要解决的问题。

AI的“科学性”在于,AI用更快的电子信号,实现对人类大脑的化学信号的学习过程的模仿、加速。AI现在还是一个刚学会说话,什么都敢说的三岁小孩。这个小孩,加以时日、持续学习,前途不可限量。

【竞赛报名/项目咨询+微信:mollywei007】

上一篇

中国学生友好学校 北卡教堂山大学的新动作

下一篇

John Locke写作比赛是什么?

你也可能喜欢

  • 暂无相关文章!

评论已经被关闭。

插入图片
返回顶部
Baidu
map