(资料图片)
01问题背景
最近用上 WebGPT 获取答案,看着它努力搜索网站,生成答案,而答案中引用的网站有豆瓣、维基百科,甚至有时候是简书。这让我不由得生出疑问:它基于什么原理去调用网页的呢? 例如,今天在看桑兵老师的《大众时代的小众读书法》。这篇文章,我首先是从阳老师的《聪明的阅读者》了解到的,并且通过阅读,知道这两个文本都提到一个让我好奇的概念:“基本书”。 什么是“基本书”?该概念的源头又是什么呢? 我向 WebGPT 提问。 我问:“《聪明的阅读者》认同“基本书”的价值,该概念是否出自桑兵这篇文章,还是出自钱穆?” 在 WebGPT 生成的答案中,我看到它的信息来源来自豆瓣,以及阳志平老师的博客。 嗯?它是如何知道去搜索阳老师的博客的呢?于是去问 GPT-4。02遇事不决GPT
我问 GPT-4:“GPT “model:web browsing” 搜索网站的原理是怎样的?如果有研究论文,请列出出处。”GPT的回答非常可爱:
“OpenAI并没有发布名为 “model:web browsing” 的模型, 我(ChatGPT)并没有直接搜索和解析网页的能力。”最后它还不忘再次强调:“再次强调,如果你想了解”model:web browsing”的相关信息,可能需要去 OpenAI 的官方网站或其他可信赖的新闻或科技资讯平台查找更新的信息。” 但这个答案显然不能与 GPT 该有的能力匹配。我继续尝试。
03修改提问方向:再次GPT
我问:“GPT “model:web browsing” 原理是怎样的?如果有论文,请在[https://arxiv.org/]搜索。” 我对原有提问修改方向有两点: 1)去掉“搜索网站”,让GPT回答聚焦对象“WebGPT”; 2)指定论文来源:[https://arxiv.org/] 这回 GPT 的回答显然好很多。 它说:WebGPT(或称为”GPT web browsing model”)的工作原理是这样的:它是一个经过微调的GPT-3模型,被训练来使用文本形式的网页浏览器更准确地回答开放式问题。这个模型模仿人类如何在线查找问题的答案——它提交搜索查询,跟踪链接,并在网页上上下滚动。模型被训练来引用其来源,这使得更容易提供反馈以提高事实准确性。模型在被提供一个开放式问题和浏览器状态的摘要后,必须发出命令,如“搜索…”,“在页面中查找:…”或“引用:…”。然后,模型从网页中收集片段,并使用这些片段来构建答案。并且它在回答中给出了相应的论文:
OpenAI 在 arXiv 上发布了一篇名为”WebGPT: Browser-assisted question-answering with human feedback”的相关论文。该论文详细描述了 WebGPT 的工作原理,包括其训练和评估过程。因此,在 GPT-4 尽责的回答中,我们不仅学习到使用 WebGPT 小技巧,如发出诸如 “搜索…”,“在页面中查找:…”或“引用:…”的指令;也得到了研究该问题的源头文章:《WebGPT: Browser-assisted question-answering with human feedback》 此刻我默默为谷歌、百度等搜索引擎的存在感到担忧了。
04加深理解:让GPT辅助阅读论文
接下来当然就是要让 GPT 辅助阅读这篇源头论文。 我提问:请阅读《WebGPT: Browser-assisted question-answering with human feedback》总结摘要、结论和研究方法。在 GPT 的回答中,我们了解到一些关键的知识。 例如,GPT 摘录作者们作出了两个主要的贡献: 1)创建了一个文本模式的网络浏览器环境,可以通过模仿学习和强化学习的一般方法,让微调后的语言模型进行交互; 2)生成带有引用的答案:模型在浏览网页时提取的文本片段。 同时,GPT 还提及研究人员使用的数据集是:Reddit 的“Explain Like I’m Five”板块的问题集 ELI5 。除此,它还会收集两种数据,一种是人类在浏览网络环境中回答的示例,另一种是同一问题的两个模型生成的答案。 (注:Reddit 是一个有些类似贴吧的网站,用户通过赞或踩来决定帖子的排序。网站上的内容分类被称为“subreddit”) 还有,WebGPT 工作原理使用了行为克隆、奖励建模、增强学习和拒绝抽样等方法。 这些信息都让我对阅读这篇论文减轻了认知负荷。这为我下一步踏入人脑阅读,开了一个很好的头。