因果推論 | Tags | Autognosis

AI・機械学習

2026年3月14日 20:28

Cross-section visualization of an AI neural network showing two layers: a clean surface layer with organized blue pathways and a deeper layer with fading red geometric patterns representing harmful representations being erased from the model's latent space

表現消去ベースの選好最適化によるLLMの有害性除去

表現消去ベースの選好最適化によるLLMの有害性除去現在のLLM安全性における表面性の問題既存の選好最適化技術—Direct Preference Optimization（DPO）、Negative Preference Optimization（NPO）、および関連手法を含む—は主に出力確率分布を修正することで行動レベルで機能します。しかし、機械的解釈可能性研究からの経験的証拠は、そのような訓練後も潜在空間に有害な表現構造が残存することを示唆していま...

#大規模言語モデル #AIセーフティ #AI倫理

--

Share

社会・働き方・ライフスタイル

2026年1月31日 16:01

メンタルモデルを通じたより良い判断力の構築

メンタルモデルを通じたより良い判断力の構築定義と機能的役割メンタルモデルとは、システム、プロセス、または現象がどのように機能するかについての形式的または非形式的な表現である(Johnson-Laird, 1983)。これらは生の感覚データと意思決定の間の仲介者として機能し、複雑性を構造化されたパターンに圧縮することで予測と行動を可能にする。意図的に構築され反復的に洗練されたメンタルモデルを採用する個人や組織が、不確実性の条件下でより速く正確な意思決定を示...

#メンタルモデル #意思決定 #システム思考

--

Share

AI・機械学習

2026年1月28日 22:02

A technical visualization showing a time series waveform transforming from an opaque black box into transparent, interpretable sparse structures with glowing nodes and connections, representing the conversion of complex predictions into explainable patterns

ブラックボックス時系列モデルにおける説明可能性の危機

ブラックボックス時系列モデルにおける説明可能性の危機ブラックボックスモデルと事前学習済みアーキテクチャは、現在、金融、医療、産業システム全体にわたる時系列予測、異常検知、センサーデータ分析を支配している。しかし、その広範な採用は、厳密な説明手法の開発を上回るペースで進んでいる。医療モニタリング、金融取引、重要インフラといった高リスク領域では、説明不可能な予測が規制上および運用上の摩擦を生み出している。組織は記録された緊張関係に直面している:優れた予測精度を活用し...

#説明可能なAI #因果推論 #深層学習

--

Share