在2015年12月,一群杰出的头脑聚在一起,有着一个共同的目标:以有益于整个人类的方式推动和发展友好的人工智能。
Sam Altman、Elon Musk、Greg Brockman、Reid Hoffman、Jessica Livingston、Peter Thiel、Amazon Web Services (AWS)、Infosys 和 YC Research 宣布了 OpenAI 的成立,并承诺投资超过 10 亿美元。该组织表示,将通过将其专利和研究对外公开以“自由合作”于其他机构和研究者合作。
OpenAI 总部位于旧金山任务区的 Pioneer 大楼。2016年4月,OpenAI 发布了“OpenAI Gym”的公共测试版,这是其用于强化学习研究的平台。2016年12月,OpenAI 发布了“Universe6”,这是一个用于衡量和训练人工智能在全球游戏、网站和其他应用上的通用智能的软件平台。
2018年,Elon Musk 辞去了董事会席位,理由是与特斯拉自动驾驶汽车的 AI 开发存在“潜在未来利益冲突”,但他仍然是一位捐赠者。2019年,OpenAI 从非营利组织转型为有限营利组织,投资获得了100倍的盈利上限。该公司向员工分发了股权,并与微软合作,微软宣布向该公司投资10亿美元。OpenAI 随后宣布打算商业授权其技术。
2020年,OpenAI 宣布了 GPT-3,这是一个经过训练的语言模型,数据源来自互联网上的数万亿字。它还宣布了一个相关的 API,简称“API”,将成为其首个商业产品的核心。GPT-3 旨在回答自然语言问题,但它还可以在不同语言之间进行翻译并生成连贯的即兴文本。2021年,OpenAI 推出了 DALL·E,这是一个可以从自然语言描述中生成数字图像的深度学习模型。
快进到2022年12月,OpenAI 推出了 ChatGPT 的免费预览版,获得了广泛的媒体报道。根据 OpenAI 的说法,该预览版在前五天内获得了超过一百万的注册。根据路透社引用的匿名消息源,OpenAI 预计2023年的收入将达到2亿美元,2024年将达到10亿美元。截至2023年1月,公司正在进行估值为290亿美元的融资谈判。
这就是 OpenAI 的故事,一个由营利性公司 OpenAI LP 和其母公司非营利性公司 OpenAI Inc 组成的人工智能研究实验室。
大多数人在 OpenAI 发布其热门的 ChatGPT 之前并不了解 OpenAI。
ChatGPT 的主要目的是模仿人类行为,与人们进行自然对话。然而,这个聊天机器人能够根据与不同用户的对话来学习和自我教育。这个人工智能具有对话能力,可以撰写教程和代码、创作音乐以及执行其他任务。ChatGPT 的用例非常多样化,几乎无穷无尽;用户已经证明了这一点。一些用例是创造性的(例如创作一首说唱歌曲),其他一些是恶意的(例如生成恶意代码或命令),还有一些是业务导向的(例如搜索引擎优化、内容营销、电子邮件营销、冷邮件和业务生产力)。
ChatGPT 简单地代表着“Generative Pre-trained Transformer”,它是建立在 OpenAI 的 GPT-3 系列大型语言模型之上的。这个聊天机器人是通过监督学习和强化学习技术进行微调的。
GPT-3 作为 ChatGPT 的基础。ChatGPT 只是一个利用 GPT-3 并添加了 Web 界面、内存和更加用户友好功能的项目。阅读完本指南后,您将能够构建自己的聊天机器人,可能比 ChatGPT 更好,因为您可以根据自己的特定需求进行自定义。
使用 GPT-3 的其他项目包括:
GitHub Copilot(使用 OpenAI Codex 模型,这是 GPT-3 的后裔,专门用于生成代码)
德雷塞尔大学(早期发现阿尔茨海默病的迹象)
Algolia(增强其搜索引擎功能)
您肯定听说过 GPT-4。GPT-4 是 GPT-3 的继任者,也是 OpenAI 创造的尚未发布的神经网络。
您可能已经看到了比较两个版本的 GPT 的图表,显示了 GPT-3(1750亿)和 GPT-4(100万亿)的参数数量。
当被问及这个病毒式的插图时,Altman 称其为“完全胡说八道”。
“关于 GPT-4 的传闻是一件荒谬的事情。我不知道这一切都是从哪里来的。
人们渴望失望,他们会失望的。这种炒作就像...我们没有真正的通用人工智能,这是人们对我们的期望。”
在同一次采访中,Altman 拒绝确认这个模型是否会在2023年发布。
关于本指南
从本指南中获得的知识将适用于当前版本(GPT-3),并且很可能也与 GPT-4(如果有的话)相关。
OpenAI 提供了用于访问其人工智能的 API(应用程序编程接口)。API 的目标是通过创建一个通用接口来抽象底层模型,使用户能够使用 GPT,而不受其版本的限制。
本指南的目标是提供一个使用 GPT-3 在项目中的逐步指南,通过这个 API。本指南还介绍了其他模型,如 CLIP、DALL-E 和 Whispers。
无论您是构建聊天机器人、人工智能助手还是提供人工智能生成数据的 Web 应用程序,本指南都将帮助您实现目标。
如果您具备 Python 编程语言的基本知识,并愿意学习一些额外的技巧,比如使用 Pandas 数据框架和一些自然语言处理技术,那么您拥有开始使用 OpenAI 工具构建智能系统所需的所有必要工具。
请放心,您不需要拥有数据科学家、机器学习工程师或人工智能专家的头衔来理解本指南中呈现的概念、技术和教程。我们的解释非常清晰,易于理解,采用简单的 Python 代码、示例和实际练习。
本指南侧重于实际操作和实践,旨在帮助读者构建真实世界的应用程序。本指南以示例为驱动,提供了许多实际示例,帮助读者理解概念并将其应用于解决实际问题。
通过学习的最后,您将构建以下应用程序:
细化的医疗聊天机器人助手
智能咖啡推荐系统
带有记忆和上下文的智能对话系统
智能语音助手,类似于 Alexa,但更智能
用于 Linux 命令的聊天机器人助手
语义搜索引擎
新闻分类预测系统
图像识别智能系统(图像转文本)
图像生成器(文本转图像)
等等!
通过阅读本指南并按照示例操作,您将能够:
了解不同的可用模型,以及何时以及如何使用每个模型。
生成各种用途的类似人类的文本,例如回答问题、创建内容等等。
控制 GPT 模型的创造力,并采纳生成高质量文本的最佳实践。
转换和编辑文本以执行翻译、格式化和其他有用的任务。
使用各种参数和选项(例如后缀、max_tokens、temperature、top_p、n、stream、logprobs、echo、stop、presence_penalty、frequency_penalty、best_of 等等)优化 GPT 模型的性能。
在使用 API 时进行词干处理、词形还原和减少费用
了解上下文填充、链接和实践使用高级技术
了解文本嵌入以及特斯拉和 Notion 等公司如何使用它
了解并实施语义搜索和其他高级工具和概念。
创建预测算法和zero-shot技术,并评估其准确性
了解、实践并改进少样本学习。
了解微调,利用其创建自己的模型的力量
了解并使用创建自己的模型的最佳实践。
使用 GPT 进行训练和分类技术。
创建高级细化模型。
使用 OpenAI Whisper 和其他工具创建智能语音助手。
使用 OpenAI CLIP 进行图像分类。
使用 OpenAI DALL·E 生成和编辑图像。
从其他图像中汲取灵感,创建您自己的图像。
从 Stable Diffusion(图像转文本)中反向工程图像提示
保持联系
如果您想要保持与 Python 和人工智能生态系统的最新趋势同步,可以加入我们的开发者社区,网址是 www.faun.dev/join9。我们每周发送必读的教程、新闻和来自软件工程专家的见解的新闻简报。
您还可以获得我们所有过去和未来指南的20%折扣,发送电子邮件至 community@faun.dev,我们将发送给您一个优惠代码。