生成式人工智能与大语言模型 (Generative AI & LLMs)

黎 浩然/ 28 8 月, 2023/ 大语言模型/LARGELANGUAGEMODEL/LLM, 机器学习/MACHINELEARNING/ 0 comments

大型语言模型的概述:LLMs是一种复杂的机器学习模型,可用于处理和生成自然语言文本。这些模型通过分析和学习海量的人类生成的数据集,掌握了语言的统计模式。

模型的用途:这些模型广泛应用于聊天机器人、文本到图像的生成、代码开发辅助工具等领域,展现出类似人类的创造能力。

聊天机器人

代码开发辅助工具

生成性人工智能:Generative AI是传统机器学习的一个子集,专注于创造新内容,而不仅仅是理解或分类现有信息。

基础模型与参数:LLMs被称为基础模型或基础模型,它们拥有数十亿个参数。这些参数可以被视为模型的记忆,参数越多,模型处理复杂任务的能力越强。

Large Language Models

模型示例与应用:课程中将使用flan-T5模型作为实验对象。学员可以通过微调技术,根据特定用例调整这些模型,快速构建定制化解决方案。

多模态生成性AI:尽管本课程重点在于语言模型和自然语言生成,生成式AI还涵盖图像、视频音频和语音等多种模态。

与模型的交互方式:与传统的机器学习和编程不同,与LLMs的交互更依赖于自然语言。用户通过“提示”(prompts)与模型交互,模型根据这些提示生成输出(completions)。

Prompts and Completions.

提示、上下文窗口与推断:提示是传递给模型的文本,上下文窗口是模型可利用的空间或记忆,通常足够容纳几千个单词。模型通过推断生成文本,根据提示预测接下来的文本。

完成与实例:模型的输出被称为“完成”,包含原始提示文本及生成的文本。

Share this Post

Leave a Comment

您的邮箱地址不会被公开。 必填项已用 * 标注

*
*