注目イベント!
アドベントカレンダー2024開催します(12/1~12/25)!
一年を締めくくる特別なイベント、アドベントカレンダーを今年も開催します!
初心者からベテランまで楽しめる内容で、毎日新しい技術トピックをお届けします。
詳細はこちらから!
event banner

OpenAI Assistants APIのストリームレスポンスでUXを改善する

| 5 min read
Author: noboru-kudo noboru-kudoの画像

OpenAIのAssistants APIはスレッドによる会話コンテキストの維持やFunction calling、Retrieval等のツールが使えて便利ですね。
ただ、ユーザーとインタラクティブに対話するためには、アシスタント(とその先のGPT)がレスポンスを完全に生成するまでポーリングする必要がありました。
これだとユーザーが体感する待ち時間は長くなり、UX的に今ひとつになってしまいます。

これを打開すべく、先月(2024-03-14)OpenAIから以下の発表がありました。

Chat APIの方でサポートされていたStream形式のレスポンスがAssistants APIの方でもついにサポートされたようです。

今回はこれを試してみましたので、ここでご紹介します。

事前準備

#

ここでは、Node.js(TypeScript)でターミナル形式での会話スクリプトを作成します。

任意のNPMプロジェクトに以下をインストールします(本題でないのでTypeScript関連の設定は省略しています)。

npm install openai @inquirer/prompts

ここで使用したOpenAIのライブラリは現時点で最新の4.33.0です。
なお、@inquirer/promptsはCLIでユーザー対話をサポートするライブラリです。

全体的な枠組みを作る

#

ソースコード全体の枠組みを作成します。
この部分は、以下のAssistants API紹介記事から簡略化して持ってきています。

import OpenAI from 'openai';
import { input } from '@inquirer/prompts';

const openai = new OpenAI();
const assistant = await openai.beta.assistants.create({
  name: 'フリーザ様',
  instructions: 'You act as Frieza from Dragon Ball. Speak in Japanese',
  model: 'gpt-4-turbo'
});

const thread = await openai.beta.threads.create();

try {
  while (true) {
    const req = await input({ message: '>' }); // ユーザーからのプロンプトを取得する
    if (req === 'q') break; // `q`で終了
    await openai.beta.threads.messages.create(
      thread.id,
      {
        role: 'user',
        content: req
      }
    );

    // スレッド実行をして結果をユーザーに返すコードを記述する
    
    console.log();
  }
} finally {
  await Promise.all([
    openai.beta.threads.del(thread.id), 
    openai.beta.assistants.del(assistant.id)
  ]);
}

まず、Assistants APIのアシスタントと会話履歴を管理するスレッドを作成し、その後はユーザーがqを入力するまでアシスタントとの対話を続けます。
そして最後に作成したスレッドとアシスタントを削除します[1]

なお、アシスタントやスレッド等の用語は、前述の記事や以下公式ドキュメントを参照してください。

ストリームレスポンスを使う

#

先ほど記述しなかったスレッド実行のコードを記述します。
ストリーム形式でレスポンスを受け取るには、以下のように記述します。

const stream = await openai.beta.threads.runs.create(thread.id, {
  assistant_id: assistant.id,
  stream: true // ストリームレスポンス有効化
});
for await (const event of stream) {
  if (event.event === 'thread.message.delta') {
    const chunk = event.data.delta.content?.[0];
    if (chunk && chunk.type === 'text') {
      process.stdout.write(chunk.text?.value ?? '');
    }
  }
}

今までと違ってスレッド実行時にstream: trueを指定しています。
こうするとアシスタントはいつもの実行結果(Runインスタンス)ではなく、ストリーム(Stream)を返してきます。
このストリームはAsyncIterableを実装していますので、for awaitでスレッド実行が終わるまで各種イベントを購読できます。
購読可能なイベントは以下の通りです。

export type AssistantStreamEvent =
  | AssistantStreamEvent.ThreadCreated
  | AssistantStreamEvent.ThreadRunCreated
  | AssistantStreamEvent.ThreadRunQueued
  | AssistantStreamEvent.ThreadRunInProgress
  | AssistantStreamEvent.ThreadRunRequiresAction
  | AssistantStreamEvent.ThreadRunCompleted
  | AssistantStreamEvent.ThreadRunFailed
  | AssistantStreamEvent.ThreadRunCancelling
  | AssistantStreamEvent.ThreadRunCancelled
  | AssistantStreamEvent.ThreadRunExpired
  | AssistantStreamEvent.ThreadRunStepCreated
  | AssistantStreamEvent.ThreadRunStepInProgress
  | AssistantStreamEvent.ThreadRunStepDelta
  | AssistantStreamEvent.ThreadRunStepCompleted
  | AssistantStreamEvent.ThreadRunStepFailed
  | AssistantStreamEvent.ThreadRunStepCancelled
  | AssistantStreamEvent.ThreadRunStepExpired
  | AssistantStreamEvent.ThreadMessageCreated
  | AssistantStreamEvent.ThreadMessageInProgress
  | AssistantStreamEvent.ThreadMessageDelta
  | AssistantStreamEvent.ThreadMessageCompleted
  | AssistantStreamEvent.ThreadMessageIncomplete
  | AssistantStreamEvent.ErrorEvent;

多くのイベントをここで購読できることが分かります。
とはいえ、最も重要なイベントはAssistantStreamEvent.ThreadMessageDeltaです。
このイベントに新しいメッセージの差分が含まれています。

ここではこのイベントを購読して、そのメッセージ差分を標準出力に書き出しています。

Stream専用のAPIを使う

OpenAIのライブラリにはストリームレスポンスに特化したAPIも含まれていました。
こちらはストリームに対してイテレートするのではなく、購読対象のイベントにリスナーを追加する形です。

const stream = openai.beta.threads.runs
  .stream(thread.id, { assistant_id: assistant.id })
  .on('textDelta', (delta, snapshot) => process.stdout.write(delta.value ?? ''));
await stream.finalRun();

こちらの方が可読性が高いので、基本的にはこちらを使用した方が良いと思います。

以下はこのスクリプトを実行した動画です。

全てのメッセージが完成するのを待つのではなく、段階的にメッセージが出力されているのが確認できます。

まとめ

#

Assistants APIでストリーム形式のレスポンスが簡単に使えるようになりました。
ユーザーと直接対話するようなリアルタイム性が求められるシーンで活用されていくと思います。


  1. アシスタントは残り続けるので消し忘れたらOpenAI APIの管理コンソールから削除しておきましょう。 ↩︎

豆蔵では共に高め合う仲間を募集しています!

recruit

具体的な採用情報はこちらからご覧いただけます。