エンタープライズAI企業のCohereは、比較的低い計算リソース要件でエンタープライズグレードのエージェントタスクに対応するよう設計された、オープンソースのMixture-of-Experts言語モデル「Command A+」のリリースを発表しました。
同社によると、このモデルはCohereのエンタープライズワークスペース「North」でのエージェントAIシステムの開発・展開に関する1年間の取り組みを基盤として構築されており、Commandファミリー全体の機能を統合した単一モデルとして、実験・展開・本番環境にわたってスケーラブルな利用を目指して設計されています。
Command A+はApache 2.0ライセンスの下で公開され、開発者はCohereが主権的AIの展開をサポートすることを目指しているモデルに広くアクセスできます。これには、組織がインフラストラクチャとモデルの動作を直接管理したい環境も含まれます。このリリースにはHugging Faceでのダウンロード可能なウェイトが含まれており、CohereのModel Vaultを通じた実装ガイダンスと展開オプションも提供されます。
同社が公開した仕様によると、このモデルはスパースMoEアーキテクチャを採用し、総パラメータ数2,180億、アクティブパラメータ数250億を持ち、128,000トークンの入力コンテキストをサポートし、最大64,000トークンを生成できます。テキスト、画像、ツール使用の入力に対応し、48言語にわたってテキスト、推論、ツール使用の出力を生成できます。
CohereはCommand A+が推論、検索拡張生成、多言語タスク、マルチモーダルドキュメント処理、エージェントワークフローに最適化されていると述べています。同社はハードウェア効率も強調し、BF16、FP8、W4A4などの複数の量子化フォーマットで利用可能で、少数のハイエンドGPUで動作できることを指摘しています。このモデルはCohereのこれまでで最速のリリースとしても位置付けられており、同社は以前のCommandモデルと比較して出力速度の向上、低レイテンシ、トークン効率の改善を挙げています。Cohereは、出力品質に影響を与えることなく推論速度をさらに向上させるために、モデルのアーキテクチャに合わせたSpeculative Decodingを採用したと述べています。
同社はCommand A+を以前のCommand Aバリアントの統合後継モデルとして説明し、長文脈推論、マルチモーダル理解、検索、コード生成などのエンタープライズ向けタスクにおいて前世代を凌駕していると述べています。CohereはCommand A Reasoningに対するベンチマークの向上も強調しており、通信関連のエージェント評価、ターミナルベースのコーディングタスク、North内で使用される内部指標において優れた結果を示しています。また、スプレッドシート分析、エージェントによる質問応答、メモリベースのワークフローにおけるパフォーマンスの向上も報告されています。
多言語対応もリリースの中心的な部分です。CohereはCommand A+がサポート言語を23言語から48言語に拡大し、翻訳と多言語推論のパフォーマンスを向上させたと述べています。同社はまた、アラビア語、韓国語、日本語のトークン化効率の改善を含む、ヨーロッパ以外の言語での向上も報告しています。マルチモーダルベンチマークでは、MathVista、MMMU、CharXiv関連の評価を含むドキュメントおよび画像推論タスクでより優れた結果を示したとされています。
このリリースへの業界の関心は富士通のコメントにも反映されており、同社はモデルのアーキテクチャとエージェントパフォーマンスが自社の主権的AI戦略と一致していると述べています。Cohereはこのリリースを、エンタープライズAIにおける3つの優先事項(機能、セキュリティ、コスト)を同時に解決するための広範な取り組みの一環と位置付けています。同社は将来の開発において、顧客が管理する環境内での展開に適したモデルを維持しながら、推論、マルチモーダルパフォーマンス、コーディングに引き続き注力していくと述べています。
Command A+はHugging Face、Model Vault、CohereのAPI、および無料のオンラインデモスペースを通じて利用できます。Cohereは、モデルをエンタープライズワークフローにテストまたは統合しようとしている組織向けに、ドキュメントと展開資料も提供していると述べています。
The post CohereがCommand A+を発表、主権的かつ効率的なエンタープライズAI展開を推進 appeared first on Metaverse Post.

