百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

OpenAI Assistants API实战指南【AI Agent】

ztj100 2025-05-25 16:48 14 浏览 0 评论

欢迎阅读这份有关使用 OpenAI 的 Assistant API 构建 AI Agent的综合指南。 本教程专为开发人员、AI 爱好者以及任何有兴趣利用 OpenAI 语言模型强大功能的人而设计。 Assistants API 提供了一个独特的机会,通过以动态和智能的方式与 AI 交互来创建定制的用户体验。 无论你是经验丰富的开发人员还是好奇的学习者,本指南都将引导你完成将 Assistants API 集成到项目中的基本步骤。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包

1、前提条件

在深入创建AI Agent之前,必须确保你拥有正确的工具和软件。 这是你需要的:

  • 代码编辑器:你选择的用于编写和编辑脚本的代码编辑器。 流行的选项包括 Visual Studio Code、PyCharm 或 Sublime Text。
  • Python 环境:确保你的系统上安装了 Python。 为了兼容,建议使用Python 3.6或更高版本。
  • OpenAI Python 库(版本 1.3.5):该库有助于将 OpenAI 的 API 集成到 Python 应用程序中。
  • API 密钥:你将需要 OpenAI API 密钥来验证你的 API 调用。 你可以从 OpenAI API Keys 获取此密钥。 确保妥善保管此密钥,并且不要公开共享。

2、Assistant API 概述

Assistants API 是一个强大的框架,由几个关键组件组成,这些组件协同工作以促进用户与 AI 之间的交互。 了解这些组件对于有效集成至关重要:

  • Assistant:助手。这是 API 的核心,是一个连接 OpenAI 模型的专用 AI。 它处理用户输入并根据启用的工具和配置的指令生成响应。
  • Thread:线程。将线程视为会话或对话。 它存储用户和助手之间交换的一系列消息。 这允许在正在进行的交互中保留上下文。
  • Message:消息。这些是添加到线程中的各个通信片段。 每条消息可以来自用户或助手。 虽然目前不支持图像文件,但文本通信提供了丰富的交互媒介。

交互从在线程中运行Assistant开始,根据用户的输入和助手的配置触发响应。 随着我们的继续,你将学习如何设置这些组件并创建一个功能性人工智能代理。

3、搭建开发环境

首先,你需要通过安装必要的库来设置开发环境。 此设置将为你提供构建和运行 AI 代理所需的工具:

  • 安装所需的库:打开命令行界面并通过运行以下命令安装 OpenAI Python 库、python-dotenv 和 colorama:
  • bash
  • pip install openai python-dotenv colorama
  • openai:这是允许你将 OpenAI 的 API 集成到 Python 应用程序中的主要库。
  • python-dotenv:该库用于管理和加载环境变量,这对于安全处理 API 密钥特别有用。
  • colorama:虽然与 API 没有直接关系,但 colorama 是一个用于生成彩色终端文本的流行库,它可以增强脚本的可用性。
  • 环境变量:出于安全原因,最佳实践是将 OpenAI API 密钥存储在环境变量中。 在项目目录中创建一个 .env 文件并添加 API 密钥,如下所示:
OPENAI_API_KEY='your_api_key_here'
  • 使用 python-dotenv 库在脚本中加载这些变量
  • 完整的开发环境设置:有关更全面的设置说明,尤其是在处理更复杂的项目结构时,请参阅 OpenAI Python 库或其他 OpenAI 资源提供的自述文件。

4、构建 AI 代理

现在,让我们深入探讨本指南的核心部分——构建人工智能代理。 请按照以下步骤创建 AI 助手并与之交互:

4.1 创建助手

你需要做的第一件事是创建一个助手。 这涉及连接到语言模型、使用自定义指令设置助手的行为以及启用代码解释器等特定工具。 你可以这样做:

# Load this securely from your environment variables import openai openai.api_key = "your_api_key_here" 

assistant = openai.Assistant.create( 
  name="Math Tutor", 
  instructions="You are a personal math tutor. Write and run code to answer math questions.", 
  tools=[{"type": "code_interpreter"}], 
  model="gpt-4-1106-preview" )

4.2 创建线程

创建助手后,设置一个用于存储交互消息的线程:

thread = openai.Thread.create()

将消息添加到线程,通过向线程添加消息来开始对话。 该消息可以是一个问题或一个命令:

message = openai.Message.create( 
  thread_id=thread.id, 
  role="user", 
  content="I need to solve the equation `3x + 11 = 14`. Can you help me?" )

4.3 运行助手

要获得助理的响应,请运行以下线程:

run = openai.Run.create( 
  thread_id=thread.id, 
  assistant_id=assistant.id, 
  instructions="Please address the user as Jane Doe. The user has a premium account." )

4.4 检查运行状态

检查运行状态以确保其成功完成非常重要:

run_status = openai.Run.retrieve( 
  thread_id=thread.id, 
  run_id=run.id ) 
print(run_status.status)

当运行处于“in_progress”状态时,线程被锁定并且无法添加消息

我们不断检查运行状态,直到状态更改为“completed”

def check_status(thread_id, run_id):
    """Checks the status of a run every second until it is completed."""
    while True:
        run = client.beta.threads.runs.retrieve(thread_id=thread_id, run_id=run_id)
        print(f"Current run status: {run.status}")
        if run.status == "completed":
            # print messages

当状态变为“completed”时,就可以进入步骤 6 并显示来自线程的消息:

def check_status(thread_id, run_id):
    """Checks the status of a run every second until it is completed."""
    while True:
        run = client.beta.threads.runs.retrieve(thread_id=thread_id, run_id=run_id)
        print(f"Current run status: {run.status}")
        if run.status == "completed":
            # print messages
            messages = client.beta.threads.messages.list( thread_id=thread.id)
            for message in messages:
                print(f"{message.role}: {message.content[0].text.value}")
            continue

你还可以让助手访问工具来扩展语言模型的功能。

在接下来的部分中,我们将深入探讨如何使用代码解释器工具、处理文件注释等。

5、代码解释器工具

代码解释器(Code Interpreter)是 Assistants API 中可用的强大工具之一。 该工具允许语言模型在安全的沙盒环境中执行 Python 代码,从而扩展了语言模型的功能。

如上一节所示,在创建助手时,你可以启用代码解释器工具。 这是通过在创建助手期间将其包含在 tools参数中来完成的:

assistant = openai.Assistant.create( 
  name="Math Tutor", 
  instructions="You are a personal math tutor. Write and run code to answer math questions.", 
  tools=[{"type": "code_interpreter"}], 
  model="gpt-4-1106-preview" )

代码解释器允许你的助手执行 Python 代码、处理文件上传和下载以及以各种方式与数据交互。 这为自动化任务、处理数据和创建交互式人工智能驱动的应用程序提供了广泛的可能性。

6、使用文件注解

在某些情况下,你可能需要助手处理文件,例如从 CSV 文件读取数据或将输出保存到文件。 以下是处理文件交互的方法:

  • 文件路径注解:当代码解释器工具处理文件时,它会引用文件路径作为消息中的注解(annotation)。 这些注解可用于本地下载文件。
  • 检索和保存文件:要使用这些文件,你需要从线程中检索它们并将它们保存到本地系统。 这是一个执行此操作的示例函数:
def save_files_from_thread(thread_id): 
  messages = openai.Message.list(thread_id=thread_id) 
  for message in messages: 
    annotations = message.content[0].text.annotations 
    if annotations: 
      for annotation in annotations: 
        if annotation.type == 'file_path': 
          file_id = annotation.file_path.file_id 
          file_data = openai.File.retrieve(file_id) 
          with open(f"downloaded_files/{file_id}.txt", "wb") as file:   
            file.write(file_data.content) 
            print(f"File {file_id} saved successfully.")

此函数迭代消息、检查文件路径注释、检索文件并将其保存在本地。

7、结束语

将 Assistant API 与 OpenAI 的语言模型集成,开启了一个充满可能性的世界。 从自动化复杂任务到增强用户与人工智能的交互,潜在的应用是广泛而多样的。 无论是开发智能应用程序、创建交互式工具,还是探索人工智能的新领域,Assistants API 都为创新和创造力提供了强大的平台。

如果你对本教程的完整源代码感兴趣,请访问 GitHub 存储库:Assistants API Code Examples。此外,以下资源可供你进一步探索和学习:

  • OpenAI API 文档:深入了解 OpenAI API 文档。
  • OpenAI 助手:在 OpenAI 助手文档中了解有关助手功能的更多信息。
  • YouTube 教程:视觉学习者可以从 YouTube 上提供的视频教程中受益。

原文链接:OpenAI Assistants API - BimAnt

相关推荐

拒绝躺平,如何使用AOP的环绕通知实现分布式锁

如何在分布式环境下,像用synchronized关键字那样使用分布式锁。比如开发一个注解,叫@DistributionLock,作用于一个方法函数上,每次调方法前加锁,调完之后自动释放锁。可以利用Sp...

「解锁新姿势」 兄dei,你代码需要优化了

前言在我们平常开发过程中,由于项目时间紧张,代码可以用就好,往往会忽视代码的质量问题。甚至有些复制粘贴过来,不加以整理规范。往往导致项目后期难以维护,更别说后续接手项目的人。所以啊,我们要编写出优雅的...

消息队列核心面试点讲解(消息队列面试题)

Rocketmq消息不丢失一、前言RocketMQ可以理解成一个特殊的存储系统,这个存储系统特殊之处数据是一般只会被使用一次,这种情况下,如何保证这个被消费一次的消息不丢失是非常重要的。本文将分析Ro...

秒杀系统—4.第二版升级优化的技术文档二

大纲7.秒杀系统的秒杀活动服务实现...

SpringBoot JPA动态查询与Specification详解:从基础到高级实战

一、JPA动态查询概述1.1什么是动态查询动态查询是指根据运行时条件构建的查询,与静态查询(如@Query注解或命名查询)相对。在业务系统中,80%的查询需求都是动态的,例如电商系统中的商品筛选、订...

Java常用工具类技术文档(java常用工具类技术文档有哪些)

一、概述Java工具类(UtilityClasses)是封装了通用功能的静态方法集合,能够简化代码、提高开发效率。本文整理Java原生及常用第三方库(如ApacheCommons、GoogleG...

Guava 之Joiner 拼接字符串和Map(字符串拼接join的用法)

Guave是一个强大的的工具集合,今天给大家介绍一下,常用的拼接字符串的方法,当然JDK也有方便的拼接字符串的方式,本文主要介绍guava的,可以对比使用基本的拼接的话可以如下操作...

SpringBoot怎么整合Redis,监听Key过期事件?

一、修改Redis配置文件1、在Redis的安装目录2、找到redis.windows.conf文件,搜索“notify-keyspace-events”...

如何使用Python将多个excel文件数据快速汇总?

在数据分析和处理的过程中,Excel文件是我们经常会遇到的数据格式之一。本文将通过一个具体的示例,展示如何使用Python和Pandas库来读取、合并和处理多个Excel文件的数据,并最终生成一个包含...

利用Pandas高效处理百万级数据集,速度提升10倍的秘密武器

处理大规模数据集,尤其是百万级别的数据量,对效率的要求非常高。使用Pandas时,可以通过一些策略和技巧显著提高数据处理的速度。以下是一些关键的方法,帮助你使用Pandas高效地处理大型数据集,从而实...

Python进阶-Day 25: 数据分析基础

目标:掌握Pandas和NumPy的基本操作,学习如何分析CSV数据集并生成报告。课程内容...

Pandas 入门教程 - 第五课: 高级数据操作

在前几节课中,我们学习了如何使用Pandas进行数据操作和可视化。在这一课中,我们将进一步探索一些高级的数据操作技巧,包括数据透视、分组聚合、时间序列处理以及高级索引和切片。高级索引和切片...

原来这才是Pandas!(原来这才是薯片真正的吃法)

听到一些人说,Pandas语法太乱、太杂了,根本记不住。...

python(pandas + numpy)数据分析的基础

数据NaN值排查,统计,排序...

利用Python进行数据分组/数据透视表

1.数据分组源数据表如下所示:1.1分组键是列名分组键是列名时直接将某一列或多列的列名传给groupby()方法,groupby()方法就会按照这一列或多列进行分组。按照一列进行分组...

取消回复欢迎 发表评论: