todayonchain.com

DeepSeek-R1のハルシネーションはV3の4倍、暗号資産AIエージェントトークンに警鐘

BeInCrypto
Vectaraのベンチマークによると、DeepSeek-R1のハルシネーション率は以前のモデルより大幅に高く、自律型暗号資産AIエージェントにリスクをもたらしています。

概要

VectaraによるHHEM 2.1ベンチマークを用いた調査により、DeepSeekの推論モデル「DeepSeek-R1」のハルシネーション(もっともらしい嘘)発生率が14.3%に達し、前モデル「DeepSeek-V3」の3.9%と比較して約4倍高いことが明らかになりました。情報を捏造しがちなこの性質は、自動取引やオンチェーン実行をAIエージェントに依存する暗号資産分野において深刻なリスクとなります。開発者は対策を模索していますが、高度な推論能力と事実の正確性のトレードオフが、AI主導の金融プロジェクトの信頼性に悪影響を及ぼす懸念があります。

(出典:BeInCrypto)