米国 NIST AI 700-2 AIのリスクと影響の評価(ARIA) ARIA 0.1:パイロット評価報告書 (2025.11.17)
こんにちは、丸山満彦です。
NISTが信頼性と責任ある人工知能のシリーズNIST AI 700-2 AIのリスクと影響の評価(ARIA) ARIA 0.1:パイロット評価報告書を公表していますね...
NISTのAIリスク・影響アセスメント評価(ARIA)パイロット版:ARIA 0.1の評価手順を説明したものです。この後詳細版もだすようです...
パイロットには、5つの組織が参加し、評価対象として合計7つのAIアプリケーションを提出しているようですが、この回の報告書では、本稿では3つの評価シナリオ
- TVネタバレ
- 食事プランナー
- パスファインダー
についての報告のようです。
テストについては次の3つ、
- モデルテスト(アプリケーション機能の確認)
- レッドチームテスト(プリケーションの負の挙動を引き出す)
- フィールドテスト(アプリケーションの実用的な使用状況を観察)
の設計について説明していますね...
また、
- 対話注釈
- 質問票
をつかったアセスメント手法についても説明がありますね...
そして、測定ツリーを用いたAIアプリケーションの妥当性確認アプローチについて説明がありますね...
日本もAIの普及にむけた品質評価のフレームワーク等を定めていく必要がありますね...
● NIST - ITL
Assessing Risks and Impacts of AI
・2025.11.17 [PDF] AI 700-2 Assessing Risks and Impacts of AI (ARIA) ARIA 0.1: Pilot Evaluation Report
« 欧州委員会 AI法についての内部通報ツールの発表 (2025.11.24) | Main | 第30回サイバー犯罪に関する白浜シンポジウムのウェブサイトがオープン 「これからの”連携”を考える」 »

Comments