生成式 AI 项目生命周期 (Generative AI project lifecycle)

Generative AI project lifecycle
问题定义:最重要一步。需要明确并狭窄地定义项目范围。这包括考虑LLM(大型语言模型)在特定应用中的功能,以及是否需要模型执行多种任务或专注于特定任务(如命名实体识别).
选择模型:接下来决定是从头开始训练自己的模型,还是使用现有的基础模型。大多数情况下,会选择现有模型,但在某些情况下,可能需要从头开始训练。
模型评估与训练:拥有模型后,下一步是评估其性能,并根据需要进行额外训练。这可能包括利用提示工程进行上下文学习或进行微调。
微调与人类反馈:当模型的表现仍不符合要求时,可以尝试微调。这个过程会在课程的第二周详细介绍。为确保模型行为与人类偏好一致,可使用额外微调技术—结合人类反馈的强化学习.
评估与迭代:评估模型的性能和偏好对齐是关键。这一阶段可能包括多次迭代,如先尝试提示工程,然后进行微调,再回到提示工程以改进性能。
模型部署与集成:模型满足性能需求并与偏好良好对齐后,将其部署到基础设施中,并与应用程序集成。此阶段的一个重要步骤是优化模型以确保最佳的计算资源利用和用户体验。
应对LLM限制:最后,考虑到LLM的一些基本限制,如倾向于在不知道答案时编造信息,或在执行复杂推理和数学方面的局限性,需要考虑额外的基础设施。