2023 年 08 月

GPT-3 基于大型语言模型构建创新NLP产品 第三章 GPT-3编程

GPT-3的几乎所有自然语言处理能力都是用Python编程语言创建的。但是为了实现更广泛的可访问性,API内置了对所有主要编程语言的支持,以便用户可以使用自己选择的编程语言来构建基于GPT-3的应用程序。 在本节中,我们将通过三种常见的编程语言来演示这是如何工作的:Python、Go和Java。 只

GPT-3 基于大型语言模型构建创新NLP产品 第二章 使用 OpenAI API

即使 GPT-3 是世界上最复杂和精湛的语言模型,它的能力对终端用户来说被抽象为一个简单的“文本输入,文本输出”接口。本章将帮助您开始使用这个界面,Playground,并涵盖 OpenAI API 的技术细节,因为这些细节揭示了真正的宝藏。 要完成本章,您需要在https://platform.o

GPT-3 基于大型语言模型构建创新NLP产品 第一章 大型语言模型的时代

"艺术是灵魂与世界碰撞的碎片" #gpt3 "技术现在是现代世界的神话" #gpt3 "革命始于一个问题,但不以一个答案结束" #gpt3 "大自然用各种各样装饰这个世界" #gpt3 想象一个美丽的阳光明媚的早晨。今天是周一,你知道这周会很繁忙。你的公司即将推出一个新款个人生产力应用程序Taskr

2023 年 07 月

The Art of ChatGPT Prompting: A Guide to Crafting Clear and Effective Prompts 总结

介绍 在这份全面的指南中,你将学习到关于如何制定清晰有效的ChatGPT提示的所有知识,这些提示将推动富有吸引力和信息性的对话。 你可以通过浏览器访问ChatGPT:https://chat.openai.com 但首先,让我们开始回答这个问题:ChatGPT是什么? ChatGPT (Genera

GPT-3 基于大型语言模型构建创新NLP产品 前言

前言 GPT-3,即Generative Pre-trained Transformer 3,是OpenAI开发的基于transformer的大型语言模型。它由高达1750亿个参数组成。任何人都可以通过简单易用的“文本输入,文本输出”用户界面访问这个大型语言模型,而无需任何技术先决条件。这是历史上第

2021 年 10 月

Spark in Action第二版翻译 第十四章 使用用户自定义的函数来扩展转换

无论你是耐心地阅读了本书的前13章,还是用直升机式的阅读方法从一章跳到另一章,你肯定会认为Spark很好,但是......Spark是可扩展的吗?你可能会问,"我怎样才能把我现有的库带入到这个组合中?我是否必须只使用DataFrame API和Spark SQL来实现我想要的所有转换?" 从本章的标

2021 年 09 月

Spark in Action第二版翻译 第十三章 改造整个Document

本章的重点是整个文档的转换。Spark将摄取一个完整的文档,对其进行转换,并以另一种格式提供给它。 在上一章中,你阅读了关于数据转换的内容。下一个合乎逻辑的步骤是转换整个文档及其结构。举个例子,JSON对于传输数据来说是很好的,但当你必须遍历它来做分析时,就会非常痛苦。类似地,加入的数据集有很多数据

Spark in Action第二版翻译 第十二章 转换你的数据

这一章可能是本书的基石。你通过前11章所收集的所有知识已经把你带到了这些关键问题上。"一旦我有了这些数据,我怎样才能转化它,我又能用它做什么?" Apache Spark是关于数据转换的,但确切地说,什么是数据转换?如何以可重复和程序化的方式进行这种转换?把它看成是一个工业过程,它将确保你的数据得到

Spark in Action第二版翻译 第十一章 使用SQL

结构化查询语言(SQL)是操作数据的黄金标准。它于1974年被引入,此后发展成为ISO标准(ISO/IEC 9075)。最新的修订是SQL:2016。 作为在关系型数据库中提取和操作数据的一种方式,SQL似乎一直存在。而且SQL将永远存在。当我在大学时,我清楚地记得问我的数据库教授:"你期望谁会使用

2021 年 08 月

Spark in Action第二版翻译 第十章 结构化Stream

从几千米(或英尺,如果你拘泥于英制)的地方看你的数据,并关注数据生成的部分。你看到的是成批生成数据的系统,还是连续生成数据的系统?提供数据流的系统,也就是所谓的流,几年前还不太流行。流肯定是越来越受欢迎了,理解流是本章的重点。 比如说,你的手机会定期对手机信号塔进行ping。如果是智能手机(根据本书