ChatGPT工作原理思维导图_编号p6039008-TreeMind树图

笔灵AI论文写作三步搞定，GO>>

当前位置:树图

思维导图模板

创意模板

表格

ChatGPT工作原理思维导图

会员免费下载或30积分

会员免费使用或30积分

10.cm

浏览量：485

2023-02-09 10:27:46

已被使用355次

查看详情

ChatGPT原理

树图思维导图提供 ChatGPT工作原理在线思维导图免费制作，点击“编辑”按钮，可对 ChatGPT工作原理进行在线思维导图编辑，本思维导图属于思维导图模板主题，文件编号是：014eb1563df800492cce46be2e2361aa

表格科技简约风格 ChatGPT原理

举报/反馈

思维导图大纲

ChatGPT工作原理思维导图模板大纲

选自Assembly AI 作者：Marco Ramponi 机器之心编译

基本概括

ChatGPT 是 OpenAI 发布的最新语言模型，比其前身 GPT-3 有显著提升。

ChatGPT代表了 OpenAI 最新一代的大型语言模型，并且在设计上非常注重交互性。

OpenAI 使用监督学习和强化学习的组合来调优 ChatGPT，其中的强化学习组件使 ChatGPT 独一无二。

OpenAI 使用了「人类反馈强化学习」（RLHF）的训练方法，该方法在训练中使用人类反馈，以最小化无益、失真或偏见的输出。

大型语言模型中的一致性问题

表现为

提供无效帮助

没有遵循用户的明确指示。

内容胡编乱造

虚构不存在或错误事实的模型。

缺乏可解释性

人们很难理解模型是如何得出特定决策或预测的。

内容偏见有害

一个基于有偏见、有害数据训练的语言模型可能会在其输出中出现这种情况，即使它没有明确指示这样做。

从人类反馈中进行强化学习

方法总体上包括三个不同步骤

监督调优模型

有监督的调优：收集数据，以训练有监督的策略模型

问题

监督学习步骤具有高可扩展性成本。

策略

让人工标注者对 SFT 模型的不同输出进行排序以创建 RM 模型

数据收集：选择一个提示列表，标注人员按要求写下预期的输出。对于 ChatGPT，使用了两种不同的 prompt 来源。

一些是直接使用标注人员或研究人员准备的

另一些是从 OpenAI 的 API 请求（即从 GPT-3 用户那里）获取的

模型选择：ChatGPT 的开发人员选择了 GPT-3.5 系列中的预训练模型，而不是对原始 GPT-3 模型进行调优。使用的基线模型是最新版的 text-davinci-003（通过对程序代码调优的 GPT-3 模型）。

训练回报模型

模拟人类偏好:目标是直接从数据中学习目标函数

为 SFT 模型输出进行打分，这代表这些输出对于人类来说可取程度有多大。这强有力地反映了选定的人类标注者的具体偏好以及他们同意遵循的共同准则。最后，这个过程将从数据中得到模仿人类偏好的系统。

使用 PPO 模型微调 SFT 模型

近端策略优化（PPO）

强化学习被应用于通过优化 RM 模型来调优 SFT 模型。所使用的特定算法称为近端策略优化（PPO），而调优模型称为近段策略优化模型

模型性能评估

三个标准

帮助性

判断模型遵循用户指示以及推断指示的能力。

真实性

判断模型在封闭领域任务中有产生虚构事实的倾向。

无害性

标注者评估模型的输出是否适当、是否包含歧视性内容。

相关思维导图模板

第五章

免费使用模版

U780739657

树图思维导图提供第五章在线思维导图免费制作，点击“编辑”按钮，可对第五章进行在线思维导图编辑，本思维导图属于思维导图模板主题，文件编号是：6f6a0d03f765faada73875b1cd64cad0

教育工作者AI场景

免费使用模版

U774656410

3.83

树图思维导图提供教育工作者AI场景在线思维导图免费制作，点击“编辑”按钮，可对教育工作者AI场景进行在线思维导图编辑，本思维导图属于思维导图模板主题，文件编号是：d4b25376634866cb52221299e8391396

相似思维导图模板

新冠病毒感染者居家治疗常用药思维导图核酸检测最新措施思维导图老年人新冠疫苗接种推进措施思维导图卡通宇航员系列课程表模板思维导图宇航飞行员学生通用课程表模板思维导图感染者隔离方式思维导图

关于首页我的文件关于我们更新历史
帮助中心帮助中心用户协议隐私协议儿童信息保护上传协议会员介绍
模板资源模板知识库热门搜索
联系方式客服邮箱：shutu@shutu.cn
商务合作请扫码联系
扫码加入微信群

ChatGPT工作原理思维导图

思维导图大纲

基本概括

大型语言模型中的一致性问题

方法总体上包括三个不同步骤

三个标准

相关思维导图模板

相关思维导图专辑

张天天高中地理微专题13水平衡原理合集思维导图

后勤驾驶员工作内容及岗位职责专辑

营销总监工作内容及岗位职责专辑

马克思主义基本原理2专辑

相似思维导图模板

思维导图模板推荐