什么是GPT-4?_千锋教育

一、GPT-4的概况

GPT-4可以接受图像和文本输入，产生文本输出。在GPT-4发布之前，外界预测会增加语音、图像、视频、文本多模态输入，输出可能也不局限于文字。但实际上，它输出任务依旧是一个自回归的单词预测任务，这与之前的预期略微不同。

整体来说，GPT-4的能力已在各种专业和学术基准上表现出了人类的水平，包括以大约前10%的成绩通过模拟律师资格考试。而对于生成式的幻觉、安全问题均有较大的改善；同时因对于图片模态的强大识别能力扩大了GPT-4的应用范围。

二、GPT-4的改进

GPT-4相比GPT-3，模型规模提升了约10倍，参数数量达到了将近1000亿个，是目前为止最大的语言模型。GPT-4的改进主要体现在以下几个方面：

1.可以开始处理图像

GPT-4是一个多模态大模型，可以接受文本和图像形式的输入，并用文本进行输出。不过，目前图像输入的权限尚未公开。

2.支持更长的上下文窗口

GPT-4 支持的上下文token数量最大可以达到32,768（大概52页文本），而GPT-3.5最大为4096个。也就是说，在单个会话中，GPT-4的提问回答的次数和篇幅都将大大提升。

3.扩写能力增强

GPT-4的扩写能力进一步增强，能处理超过25000个单词的文本，并允许使用长形式的内容创建、扩展会话、文档搜索和分析等功能。

4.响应更高层次的问答

相较于GPT-3，GPT-4可以响应更高层次的问答，比如类比、推理、推广以及类比问题。同时，GPT-4在更复杂、更细微的任务处理上，回答更可靠、更有创意。

5.零样本学习

GPT-4拥有更强的零样本学习能力，即能够在没有大量样本的情况下完成任务。这项新能力可以在实际应用中大幅降低数据收集和标注的成本，同时也使得GPT-4更容易应用到一些新的领域。

三、GPT-4的应用

随着GPT-4性能和功能的改进，其应用范围也进一步扩大，以下为详细介绍：

GPT-4的可控制的生成能力可以在文学创作领域得到广泛应用。作家可以使用GPT-4来创作小说、剧本等文学作品。同时，GPT-4还可以用于广告创意的生成，为企业提供更加个性化、有创意的广告宣传语。GPT-4更高的智能对话能力使其可以在智能客服、智能家居等领域得到广泛应用。它能够更好地理解用户意图，进行更加自然、流畅的对话。GPT-4拥有更强的多模态处理能力，可以在图像识别领域得到广泛应用。它可以处理不仅仅是自然语言，还可以理解图像、声音、视频等多种媒介。GPT-4的更高的智能对话能力使得它在智能客服领域有着广泛的应用前景。GPT-4可以更好地理解用户的问题和需求，并提供更加自然、流畅的回答。这对于企业的客户服务质量提升、效率提升都有着积极的作用。

此外，GPT-4收费方式也跟GPT-3.5不一样，它区分prompt和completion，实施不一样的收费标准。而GPT-3.5统一收费$0.002/ 1k tokens。GPT-4最便宜的收费标准都比GPT-3.5贵15倍，而最贵的收费标准比3.5贵60倍！