Autognosis

自分の認知と学習を静かに磨くデジタルノート

速く流れていく情報から少し離れ、自分の頭でじっくり考えられる文章だけを集めています。

更新

2026/3/29

Tag

#因果推論

AI・機械学習
2026年3月14日 20:28
Cross-section visualization of an AI neural network showing two layers: a clean surface layer with organized blue pathways and a deeper layer with fading red geometric patterns representing harmful representations being erased from the model's latent space

表現消去ベースの選好最適化によるLLMの有害性除去

表現消去ベースの選好最適化によるLLMの有害性除去 現在のLLM安全性における表面性の問題 既存の選好最適化技術—Direct Preference Optimization(DPO)、Negative Preference Optimization(NPO)、および関連手法を含む—は主に出力確率分布を修正することで行動レベルで機能します。しかし、機械的解釈可能性研究からの経験的証拠は、そのような訓練後も潜在空間に有害な表現構造が残存することを示唆していま...

-- いいね数
続きを読む
Side profile of a translucent head showing a brain with an illuminated network of interconnected nodes and pathways that extend outward, transforming into structured diagrams and flowcharts, representing the concept of mental models organizing complex information

メンタルモデルを通じたより良い判断力の構築

メンタルモデルを通じたより良い判断力の構築 定義と機能的役割 メンタルモデルとは、システム、プロセス、または現象がどのように機能するかについての形式的または非形式的な表現である(Johnson-Laird, 1983)。これらは生の感覚データと意思決定の間の仲介者として機能し、複雑性を構造化されたパターンに圧縮することで予測と行動を可能にする。意図的に構築され反復的に洗練されたメンタルモデルを採用する個人や組織が、不確実性の条件下でより速く正確な意思決定を示...

#メンタルモデル #意思決定 #システム思考
-- いいね数
続きを読む
AI・機械学習
2026年1月28日 22:02
A technical visualization showing a time series waveform transforming from an opaque black box into transparent, interpretable sparse structures with glowing nodes and connections, representing the conversion of complex predictions into explainable patterns

ブラックボックス時系列モデルにおける説明可能性の危機

ブラックボックス時系列モデルにおける説明可能性の危機 ブラックボックスモデルと事前学習済みアーキテクチャは、現在、金融、医療、産業システム全体にわたる時系列予測、異常検知、センサーデータ分析を支配している。しかし、その広範な採用は、厳密な説明手法の開発を上回るペースで進んでいる。医療モニタリング、金融取引、重要インフラといった高リスク領域では、説明不可能な予測が規制上および運用上の摩擦を生み出している。組織は記録された緊張関係に直面している:優れた予測精度を活用し...

-- いいね数
続きを読む
TOPへ