1. 首页 / 快讯 /  正文

天天新动态:chatgpt是横空出世吗 chatgpt是如何进化的

天天新动态:chatgpt是横空出世吗 chatgpt是如何进化的

chatgpt是横空出世吗

当地时间2月4日,Gmail的创始人Paul Buchheit在推特上表示,像ChatGPT这样的人工智能聊天机器人将像搜索引擎杀死黄页一样摧毁谷歌。

去年11月ChatGPT刚上线后不久,Buchheit就曾在社交媒体上大胆“开麦”称,一到两年里谷歌将被彻底颠覆。


(资料图片)

“谷歌可能只需要一两年时间就会被彻底颠覆。AI将会消灭搜索引擎的结果页面,即使后者跟上了人工智能的发展,也将导致其业务中最能赚钱的部分大不如前!”Buchheit在上周的推特上说。

人工智能取代搜索

Buchheit是谷歌第23位员工,并亲手打造了Gmail,他参与开发了谷歌第一个AdSense原型,这是一个在谷歌网站上向用户推送针对性的广告的系统,出版商可以从页面浏览量中获利。他现在是YCombinator的合伙人。

Buchheit认为,打破谷歌垄断的可能不是ChatGPT本身,但技术的进步肯定会改变人们访问信息的方式。

“我想象的方式是,浏览器的URL/搜索栏被人工智能取代,在我输入时自动完成我的想法/问题,同时提供最佳答案(可能是一个网站或产品的链接)。人工智能将使用旧的搜索引擎后端来收集相关信息和链接,然后为用户汇总。”Buchheit在推特上详述了谷歌可能会被颠覆的方式,他认为这就像让一个专业的人类研究人员来做这项工作,只不过人工智能会立即完成人类需要花费数分钟才能完成的工作。

公开资料显示,ChatGPT为人工智能公司OpenAI于2022年11月推出的聊天机器人,能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务,因此有望成为提高办公、学习效率的工具。

瑞银报告数据显示,截至今年一月末,ChatGPT的月活用户已突破1亿,这距离它推出不过2个月时间,成为史上增长最快的消费者应用。

广告收入是谷歌的生命线。尽管更为人熟知的产品是搜索引擎,该公司大部分收入来自销售广告,搜索引擎作为广告的展示平台。

财报显示,2022年四季度谷歌广告收入为590.42亿美元,同比下降3.6%。作为核心业务,广告业务贡献了总营收的77.58%。自2020年疫情爆发时出现首次下滑之外,这是近年来,谷歌广告收入第二次出现下滑。

Buccheit并不是第一个就ChatGPT对谷歌的潜在影响敲响警钟的人。去年12月,谷歌对该聊天工具发出了“红色代码”警告。

据《纽约时报》12月报道,自ChatGPT的最新版本于11月30日发布以来,谷歌及其母公司Alphabet的首席执行官SundarPichai已经参加了围绕谷歌人工智能战略的几次会议,商讨如何应对ChatGPT对公司搜索引擎的威胁。

《泰晤士报》1月报道,该公司还召集了谷歌联合创始人拉里·佩奇和谢尔盖·布林来一同解决这个问题。当时,微软计划使用ChatGPT为其自己的搜索引擎Bing提供动力。

最新消息显示,微软正在迅速推进开发团队OpenAI的工具商业化,计划将包括ChatGPT、DALL-E等人工智能工具整合进微软旗下的所有产品中,并将其作为平台供其他企业使用。

chatgpt是如何进化的

如果用一句话来说明ChatGPT是什么,可以将它理解为由AI驱动的聊天机器人。

外界往往认为语言学领域是人工智能派上用场的绝佳地带,而事实并非如此。截至目前,人工智能还没有找到征服语言领域的暗门,即使是谷歌、苹果这样的顶级科技公司,都面临着相关AI研究成果派不上用场的苦恼。

尚处在免费试用阶段的ChatGPT,关注度短短几天扩大到燎原之势,正是因为人们从中看到了人工智能和语言本体之间的真正接口。

那么,ChatGPT采取了什么方式达到了如此惊艳的效果呢?为何苹果的Siri至今无法生成一篇学术论文,亚马逊的Alexa无法吟出一首莎士比亚十四行诗呢?

过去十年间,谷歌、Facebook、亚马逊、苹果和微软等硅谷科技巨头纷纷开启AI军备竞赛,先后成立专门的AI实验室,而最终业界公认的做纯AI研究的顶级实验室只有三家:背靠谷歌的DeepMind、背靠微软的OpenAI和背靠Facebook的FAIR。其中,被谷歌收购的DeepMind因拥有AlphaGo最为家喻户晓。

OpenAI在2015年底创立于旧金山,其联合创始人是马斯克以及硅谷知名孵化器Y Combinator的前掌门人奥特曼。不过,近年马斯克多以OpenAI的出资人角色出现,奥特曼才是这家公司的主导者和现任CEO。

不到五年时间,OpenAI就依靠GPT3跃升为全球AI领域顶级公司,与DeepMind并称AI圈的“双子星”。事实上,Meta的Fair实验室也一直在自然语言处理和对话型AI领域深耕,但其成果以发表论文为主,显得较为低调。今年6月,大举向元宇宙转型的Meta决定AI部门不再“集中化研究”,而是分布式下放,以便与实际业务结合,导致Fair的前途并不明朗。

OpenAI足以与AlphaGo一战的“武器”正是GPT3,这个2020年推出的巨型语言处理模型怪兽,可以完成诸如答题、写论文、文本摘要、语言翻译和生成代码等壮举,其诞生被视作人工智能竞赛的里程碑事件。

ChatGPT的前世今生

如果梳理OpenAI的GPT(Generative Pre-trained Transformer)系列技术路线,可以探寻出OpenAI的布局思路。

OpenAI最初提出的GPT1,采取的是生成式预训练Transform模型(一种采用自注意力机制的深度学习模型),此后整个GPT系列都贯彻了这一谷歌2017年提出,经由OpenAI改造的伟大创新范式。

简要来说,GPT1的方法包含预训练和微调两个阶段,预训练遵循的是语言模型的目标,微调过程遵循的是文本生成任务的目的。

2019年,OpenAI继续提出GPT-2,所适用的任务开始锁定在语言模型。GPT2拥有和GPT1一样的模型结构,但得益于更高的数据质量和更大的数据规模,GPT-2有了惊人的生成能力。不过,其在接受音乐和讲故事等专业领域任务时表现很不好。

2020年的GPT3将GPT模型提升到全新的高度,其训练参数是GPT-2的10倍以上,技术路线上则去掉了初代GPT的微调步骤,直接输入自然语言当作指示,给GPT训练读过文字和句子后可接续问题的能力,同时包含了更为广泛的主题。

图源:Medium GPT系列模型的数据集训练规模

现在的ChatGPT则是由效果比GPT3更强大的GPT-3.5系列模型提供支持,这些模型使用微软Azure AI超级计算基础设施上的文本和代码数据进行训练。

具体来说,ChatGPT在一个开源数据集上进行训练,训练参数也是前代GPT3的10倍以上,还多引入了两项功能:人工标注数据和强化学习,相当于拿回了被GPT3去掉的微调步骤,实现了在与人类互动时从反馈中强化学习。

也因此,我们得以看到一个强大的ChatGPT:能理解人类不同指令的含义,会甄别高水准答案,能处理多元化的主题任务,既可以回答用户后续问题,也可以质疑错误问题和拒绝不适当的请求。

当初,GPT-3只能预测给定单词串后面的文字,而ChatGPT可以用更接近人类的思考方式参与用户的查询过程,可以根据上下文和语境,提供恰当的回答,并模拟多种人类情绪和语气,还改掉了GPT-3的回答中看似通顺,但脱离实际的毛病。

展现出ChatGPT对问题分辨能力的一则回答

不仅如此,ChatGPT能参与到更海量的话题中来,更好的进行连续对话,有上佳的模仿能力,具备一定程度的逻辑和常识,在学术圈和科技圈人士看来时常显得博学而专业,而这些都是GPT-3所无法达到的。

ChatGPT自己回答与前代GPT3的能力区别

尽管目前ChatGPT还存在很多语言模型中常见的局限性和不准确问题,但毋庸置疑的是,其在语言识别、判断和交互层面存在巨大优势。同属于生成式AI范畴,ChatGPT在速度上已经比DeepMind研究人员提出的聊天机器人Sparrow(麻雀)模型领先一步。

有分析指出,OpenAI一直坚定不移的只用自然文本的上文来训练模型推动了GPT3到ChatGPT的成果,其顺应了人类思考的逻辑,最终由量变推动了质变。

chatgpt是横空出世吗

当地时间2月4日,Gmail的创始人Paul Buchheit在推特上表示,像ChatGPT这样的人工智能聊天机器人将像搜索引擎杀死黄页一样摧毁谷歌。

去年11月ChatGPT刚上线后不久,Buchheit就曾在社交媒体上大胆“开麦”称,一到两年里谷歌将被彻底颠覆。

“谷歌可能只需要一两年时间就会被彻底颠覆。AI将会消灭搜索引擎的结果页面,即使后者跟上了人工智能的发展,也将导致其业务中最能赚钱的部分大不如前!”Buchheit在上周的推特上说。

人工智能取代搜索

Buchheit是谷歌第23位员工,并亲手打造了Gmail,他参与开发了谷歌第一个AdSense原型,这是一个在谷歌网站上向用户推送针对性的广告的系统,出版商可以从页面浏览量中获利。他现在是YCombinator的合伙人。

Buchheit认为,打破谷歌垄断的可能不是ChatGPT本身,但技术的进步肯定会改变人们访问信息的方式。

“我想象的方式是,浏览器的URL/搜索栏被人工智能取代,在我输入时自动完成我的想法/问题,同时提供最佳答案(可能是一个网站或产品的链接)。人工智能将使用旧的搜索引擎后端来收集相关信息和链接,然后为用户汇总。”Buchheit在推特上详述了谷歌可能会被颠覆的方式,他认为这就像让一个专业的人类研究人员来做这项工作,只不过人工智能会立即完成人类需要花费数分钟才能完成的工作。

公开资料显示,ChatGPT为人工智能公司OpenAI于2022年11月推出的聊天机器人,能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务,因此有望成为提高办公、学习效率的工具。

瑞银报告数据显示,截至今年一月末,ChatGPT的月活用户已突破1亿,这距离它推出不过2个月时间,成为史上增长最快的消费者应用。

广告收入是谷歌的生命线。尽管更为人熟知的产品是搜索引擎,该公司大部分收入来自销售广告,搜索引擎作为广告的展示平台。

财报显示,2022年四季度谷歌广告收入为590.42亿美元,同比下降3.6%。作为核心业务,广告业务贡献了总营收的77.58%。自2020年疫情爆发时出现首次下滑之外,这是近年来,谷歌广告收入第二次出现下滑。

Buccheit并不是第一个就ChatGPT对谷歌的潜在影响敲响警钟的人。去年12月,谷歌对该聊天工具发出了“红色代码”警告。

据《纽约时报》12月报道,自ChatGPT的最新版本于11月30日发布以来,谷歌及其母公司Alphabet的首席执行官SundarPichai已经参加了围绕谷歌人工智能战略的几次会议,商讨如何应对ChatGPT对公司搜索引擎的威胁。

《泰晤士报》1月报道,该公司还召集了谷歌联合创始人拉里·佩奇和谢尔盖·布林来一同解决这个问题。当时,微软计划使用ChatGPT为其自己的搜索引擎Bing提供动力。

最新消息显示,微软正在迅速推进开发团队OpenAI的工具商业化,计划将包括ChatGPT、DALL-E等人工智能工具整合进微软旗下的所有产品中,并将其作为平台供其他企业使用。

chatgpt是如何进化的

如果用一句话来说明ChatGPT是什么,可以将它理解为由AI驱动的聊天机器人。

外界往往认为语言学领域是人工智能派上用场的绝佳地带,而事实并非如此。截至目前,人工智能还没有找到征服语言领域的暗门,即使是谷歌、苹果这样的顶级科技公司,都面临着相关AI研究成果派不上用场的苦恼。

尚处在免费试用阶段的ChatGPT,关注度短短几天扩大到燎原之势,正是因为人们从中看到了人工智能和语言本体之间的真正接口。

那么,ChatGPT采取了什么方式达到了如此惊艳的效果呢?为何苹果的Siri至今无法生成一篇学术论文,亚马逊的Alexa无法吟出一首莎士比亚十四行诗呢?

过去十年间,谷歌、Facebook、亚马逊、苹果和微软等硅谷科技巨头纷纷开启AI军备竞赛,先后成立专门的AI实验室,而最终业界公认的做纯AI研究的顶级实验室只有三家:背靠谷歌的DeepMind、背靠微软的OpenAI和背靠Facebook的FAIR。其中,被谷歌收购的DeepMind因拥有AlphaGo最为家喻户晓。

OpenAI在2015年底创立于旧金山,其联合创始人是马斯克以及硅谷知名孵化器Y Combinator的前掌门人奥特曼。不过,近年马斯克多以OpenAI的出资人角色出现,奥特曼才是这家公司的主导者和现任CEO。

不到五年时间,OpenAI就依靠GPT3跃升为全球AI领域顶级公司,与DeepMind并称AI圈的“双子星”。事实上,Meta的Fair实验室也一直在自然语言处理和对话型AI领域深耕,但其成果以发表论文为主,显得较为低调。今年6月,大举向元宇宙转型的Meta决定AI部门不再“集中化研究”,而是分布式下放,以便与实际业务结合,导致Fair的前途并不明朗。

OpenAI足以与AlphaGo一战的“武器”正是GPT3,这个2020年推出的巨型语言处理模型怪兽,可以完成诸如答题、写论文、文本摘要、语言翻译和生成代码等壮举,其诞生被视作人工智能竞赛的里程碑事件。

ChatGPT的前世今生

如果梳理OpenAI的GPT(Generative Pre-trained Transformer)系列技术路线,可以探寻出OpenAI的布局思路。

OpenAI最初提出的GPT1,采取的是生成式预训练Transform模型(一种采用自注意力机制的深度学习模型),此后整个GPT系列都贯彻了这一谷歌2017年提出,经由OpenAI改造的伟大创新范式。

简要来说,GPT1的方法包含预训练和微调两个阶段,预训练遵循的是语言模型的目标,微调过程遵循的是文本生成任务的目的。

2019年,OpenAI继续提出GPT-2,所适用的任务开始锁定在语言模型。GPT2拥有和GPT1一样的模型结构,但得益于更高的数据质量和更大的数据规模,GPT-2有了惊人的生成能力。不过,其在接受音乐和讲故事等专业领域任务时表现很不好。

2020年的GPT3将GPT模型提升到全新的高度,其训练参数是GPT-2的10倍以上,技术路线上则去掉了初代GPT的微调步骤,直接输入自然语言当作指示,给GPT训练读过文字和句子后可接续问题的能力,同时包含了更为广泛的主题。

图源:Medium GPT系列模型的数据集训练规模

现在的ChatGPT则是由效果比GPT3更强大的GPT-3.5系列模型提供支持,这些模型使用微软Azure AI超级计算基础设施上的文本和代码数据进行训练。

具体来说,ChatGPT在一个开源数据集上进行训练,训练参数也是前代GPT3的10倍以上,还多引入了两项功能:人工标注数据和强化学习,相当于拿回了被GPT3去掉的微调步骤,实现了在与人类互动时从反馈中强化学习。

也因此,我们得以看到一个强大的ChatGPT:能理解人类不同指令的含义,会甄别高水准答案,能处理多元化的主题任务,既可以回答用户后续问题,也可以质疑错误问题和拒绝不适当的请求。

当初,GPT-3只能预测给定单词串后面的文字,而ChatGPT可以用更接近人类的思考方式参与用户的查询过程,可以根据上下文和语境,提供恰当的回答,并模拟多种人类情绪和语气,还改掉了GPT-3的回答中看似通顺,但脱离实际的毛病。

展现出ChatGPT对问题分辨能力的一则回答

不仅如此,ChatGPT能参与到更海量的话题中来,更好的进行连续对话,有上佳的模仿能力,具备一定程度的逻辑和常识,在学术圈和科技圈人士看来时常显得博学而专业,而这些都是GPT-3所无法达到的。

ChatGPT自己回答与前代GPT3的能力区别

尽管目前ChatGPT还存在很多语言模型中常见的局限性和不准确问题,但毋庸置疑的是,其在语言识别、判断和交互层面存在巨大优势。同属于生成式AI范畴,ChatGPT在速度上已经比DeepMind研究人员提出的聊天机器人Sparrow(麻雀)模型领先一步。

有分析指出,OpenAI一直坚定不移的只用自然文本的上文来训练模型推动了GPT3到ChatGPT的成果,其顺应了人类思考的逻辑,最终由量变推动了质变。