Cekura (YC F24) がローンチ:音声・チャットAIエージェントのテストと監視を革新
-
FromHacker News (AI)
Cekuraは、音声およびチャットAIエージェントのテストと監視を強化するプラットフォームです。
従来のAIエージェントのテストは、手動QAの限界、ユーザーからのクレームを待つ遅延、または壊れやすいスクリプトテストに依存していました。Cekuraは、合成ユーザーによる会話シミュレーションと、LLMベースの評価者による会話全体の評価により、この問題を解決します。
主な機能:
- シナリオ生成と実会話インポート: エージェントの説明からテストスイートを自動生成し、実際のユーザー会話からテストケースを抽出してカバレッジを向上。
- モックツールプラットフォーム: 実際のAPIに依存せず、ツールのスキーマ、動作、戻り値を定義してツールの選択と意思決定をテスト。
- 決定的かつ構造化されたテストケース: LLMの確率性を排除し、明示的な条件と固定メッセージによる一貫性のあるテスト実行を実現。
Cekuraは、単一のLLM呼び出しのデバッグに焦点を当てるTracingプラットフォームとは異なり、会話全体のセッション単位での評価に特化しています。これにより、個々のターンでは問題なく見えても、セッション全体として不具合があるケース(例:検証フローのスキップ)を検出できます。
現在、7日間の無料トライアルを提供しており、有料プランは月額30ドルから利用可能です。
[custom_js_sp]
AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。
