メインコンテンツへスキップ

忙しい方のためのカメラ関連ニュース
海外のカメラ関連ニュースを翻訳してお届け


Cekura (YC F24) がローンチ:音声・チャットAIエージェントのテストと監視を革新

  • From 
    Hacker News (AI)

Cekuraは、音声およびチャットAIエージェントのテストと監視を強化するプラットフォームです。

従来のAIエージェントのテストは、手動QAの限界、ユーザーからのクレームを待つ遅延、または壊れやすいスクリプトテストに依存していました。Cekuraは、合成ユーザーによる会話シミュレーションと、LLMベースの評価者による会話全体の評価により、この問題を解決します。

主な機能:

  • シナリオ生成と実会話インポート: エージェントの説明からテストスイートを自動生成し、実際のユーザー会話からテストケースを抽出してカバレッジを向上。
  • モックツールプラットフォーム: 実際のAPIに依存せず、ツールのスキーマ、動作、戻り値を定義してツールの選択と意思決定をテスト。
  • 決定的かつ構造化されたテストケース: LLMの確率性を排除し、明示的な条件と固定メッセージによる一貫性のあるテスト実行を実現。

Cekuraは、単一のLLM呼び出しのデバッグに焦点を当てるTracingプラットフォームとは異なり、会話全体のセッション単位での評価に特化しています。これにより、個々のターンでは問題なく見えても、セッション全体として不具合があるケース(例:検証フローのスキップ)を検出できます。

現在、7日間の無料トライアルを提供しており、有料プランは月額30ドルから利用可能です。

製品紹介ビデオ: https://www.youtube.com/watch?v=n8FFKv1-nMw

[custom_js_sp]

AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。

今週の人気ニュース

アップル関連のニュースはこちら