最近火爆全国的ChatGPT在码农圈子和科技榜持续升温,国内玩家参与从典型技术问答到场景剧构建,从论文代写到聊天解闷的一系列体验工作。让文能写文章,武能改BUG的ChatGPT赚足了眼球,让一直以来对于人工智能的理解就是投入有大就有多智能的偏见好像荡然无存,对chatGPT是否可以通过图灵测试充满遐想。
01
—
ChatGPT的由来
ChatGPT是一款人工智能技术驱动的智能对话机器人(背后是基于强大的GPT-3的智能奖励模型),由硅谷创始人工智能公司OpenAI于2022年12月份发布,马斯克是早起公司创始人之一,不得不感慨大佬对于技术的前瞻性足够深远。
ChatGPT智能对话机器人的突破性在于其良好的体验效果,它能够通过学习和理解人类的语言来进行对话,能够准确获取聊天上下文进行互动,真正像人类一样来聊天交流(当前版本通过图灵测试应该没有太大悬念),真正的文能写文案,武能改缺陷!
ChatGPT的版本历程
过去数年,内容生产模式从专业生产内容(Professionally-generatedContent)为主导走向用户生产内容(User-generatedContent)模式,抖音、头条、小红书、B站等平台就是典型的用户生成内容平台。从21年开始的AI生产内容(AIGeneratedContent)时代渐进,也许不久的将来大部分的平台新闻稿都是由AI根据用户喜好和实时事件进行新闻编写和推动。如今ChatGPT的浪潮打开了AIGC的想象空间,参考2022年OpenAI公司发布的GPT-3模型来看它几乎阅览了互联网上所有数据,并且构建复杂模型进行深度学习。据此,ChatGPT可以进行答疑解惑、编写代码、撰写论文、创作诗歌和钢琴曲知识类似乎不在话下。后续随着OpenAI公司持续对GPT模型的升级迭代可以为ChatGPT提供更多的开放式话题处理能力。
知识和创新性问答
02
—
ChatGPT的原理
ChatGPT是AIGC发展的一个里程碑,背后是自然语言处理(NLP)技术发展演进的身影。
ChatGPT 背后的功臣是RLHF 技术,它是强化学习方式依据人类反馈优化语言模型,是NLP的一种演进分支技术。字面上说,RLHF就是基于人类反馈(Human Feedback)对语言模型进行强化学习(Reinforcement Learning)。
RLHF 是一项涉及多个模型和不同训练阶段的复杂概念,可以简单按照三个步骤理解:
- 预训练一个语言模型 (LM) ;
- 聚合问答数据并训练一个奖励模型 (Reward Model,RM) ;
- 用强化学习 (RL) 方式微调 LM。
怎么理解这三个步骤呢,我们以大家熟悉的豆瓣类网站对电影评分的角度来理解:
- 最开始还没有观众观看或者还有仅有少部分人观看,那此时是由平台参考当前电影的分类给一个基准分如5分,对应到预训练的LM;
- 随着观影人数增多,每个人都按照自己的衡量标准打分,就会使打分一直是动态的、更精准的评分,如到5.5分,对应到奖励模型RM;
- 一个资深影评和一个普通影评的话语权能一样吗?此时应该会给资深影评更多的权重,对应到强化学习RL来微调LM或者使RM模型更精确。
人工智能的算法一定要是个白盒算法,但是大部分没有从事人工智能的码农们无法理解这个模型如何去构建、训练和强化,其他行业更是两眼一抹黑,看到的模型完全是个黑盒子。所以这里不用太多关注RLHF模型强大的逻辑。
国内大部分的智能对话机器人都是基于NLP通过主动知识触发、推荐等实现智能回答、多轮对话驱动。我们来看下NLP的核心大概就知道如何进行匹配问答:NLP自然语言处理技术按照技术难度分为简单匹配式、模糊匹配式、段落理解式。简单匹配式主要是通过关键字匹配技术实现提出问题和类库中条目的匹配进行自动应答,模糊匹配式增加了同义词、反义词匹配;段落理解式是可理解的,智能化的,可以理解为现在或者更高智能的ChatGPT功能。
NLP本质还是将结构化数据(关系型数据库数据)、非结构化(网页数据、文档数据、图片、语音和视频数据等)从视觉、文字、语音、行为等多个维度进行数据抽取,完成实体模型分词和分类,并通过深度学习模型培训每个词语义和上下级关系来学习理解人类语言。这样来实现文章翻译、摘要、对话、聚类、情感、纠错等功能。
NLP和深度学习逻辑
03
—
ChatGPT的冲击力
看完上面ChatGPT能提供的功能我们来看下可能会影响众多行业:
首当其冲的还是技术问答和模拟人类语言/反馈的场景交流,像新闻、文章的编写和生成相信后面占比会丰富起来,同时基于人口客服的响应也会逐步由AI机器人来取代。毕竟GPT的模型数据训练量目前已经达到惊人的1750亿参数数目。
其次针对创新性问题我觉得ChatGPT会逐步渗透,就像现在ChatGPT完全可以写一段逻辑代码,针对脑洞大开的创新是不是ChatGPT在后续版本中通过模型升级来提供更惊人的体验和意想不到的效果。
回到ChatGPT的背后技术实现, ChatGPT依靠GPT系列模型结合用户反馈,对海量数据源的提取、情景的深度学习正好和优化还需要持续投入巨大的精力,此外对于专业领域、敏感问题的优化、以及对于当前准实时事件的捕获还需要通过模型持续迭代。最后,ChatGPT掀起的体验风暴是否可能会沉淀出来几种可行的商业模式,还需要各个行业和产业界共同的探索。但是技术的探索没有止境,数字化转型浪潮中产生的海量数据配合AI人工智能必将会打造一个又一个的进步阶梯。
还没有评论,来说两句吧...