ChatGPT
ChatGPT
不是从网络中获取数据进行问题的回答,本质是一种文字接龙游戏,会从随机区域中获取概率最大的数字进行拼凑
- 训练:可以比喻为你在考试前的疯狂复习,将知识装入大脑中
- 测试:可以比喻为你在考试,根据题目进行回答
ChatGPT的关键技术:预训练(Pre-train)
自督导式学习 基石模型
网络的每一段文字都可以进行训练,教机器做文字接龙
- 2018年的GPT-1 => Model 117M个参数
- 2019年的GPT-2 => Model 1542M个参数
- 2020年的GPT-3 => Model 175B个参数 训练资料Data 570GB
GPT-> (预训练 自督导式学习) -> ChatGPT
人工就是督导式学习,不用人工产生的资料就是自督导式学习
- 督导式学习:需要提供出正确的答案
- 增强式学习:只要👍和👎,给答案进行反馈对/错即可
研究方向
- 如何更准确提出需求
- 如何修正GPT的错误答案
- 如何检验,区分出GPT和人工的文字
社会化发展方向
- 依靠网络数据进行学习
- GPT提供问题,人工给出答案(只需要少量答案就可以很好修正GPT的答案,主要是让GPT明白人们想要什么答案)