大语言模型的的应用场景与任务 (LLM use cases and tasks)
聊天任务:虽然LLMs在聊天机器人领域非常突出,但它们的应用远不止于此。
文本生成:LLMs可以用于各种文本生成任务,如根据提示撰写论文、总结对话(模型根据提供的对话内容生成摘要)等。

撰写论文

总结对话
翻译任务:LLMs不仅能用于传统的语言之间的翻译(如法语到德语、英语到西班牙语等),还能将自然语言翻译成机器代码。例如,可以要求模型编写Python代码,以计算数据帧中每列的平均值。

翻译任务

编写Python代码
信息检索:使用LLMs进行更加专注的小型任务,如识别新闻文章中的所有人名和地名(命名实体识别和词汇分类)。

命名实体识别
连接外部数据源和API:LLMs 的一个活跃发展领域是将它们与外部数据源相连或用于调用外部API,这样可以提供模型在预训练中没有的信息,并使模型能够与现实世界互动。

连接外部数据源和API
基础模型的规模和理解力:随着基础模型从数亿参数增长到数十亿甚至数千亿参数,模型对语言的主观理解也在增强。这种语言理解嵌入在模型参数中,使得模型能够处理、推理并最终解决给定的任务。
小型模型的微调:即便是较小模型,也可通过微调在特定的集中任务上表现良好。课程第二周将更详细地讨论这一点。
LLMs的快速发展:LLMs在过去几年的快速能力提升,很大程度上归功于其背后的架构。