從哲學角度看人工智慧幻覺

為什麼AI會產生「看似真實的謊言」？

「明明在講技術，為什麼還要談哲學呢？」

在解釋AI的過程中，時常會見到如此的表情。
然而，當我們深入探討AI，特別是其被稱為「黑箱」的特性之謎時，我們會碰到技術性的方法無法解釋的瓶頸，不得不踏入哲學的領域。

這個現象的典型例子就是AI生成的「幻覺（ハルシネーション）」問題。

追溯這些幻覺的根源，最終必然會抵達「『知識』究竟是什麼意思？」這一古老的哲學問題。

在這裡，我們將按步驟深入探討這一深奧的主題。

在AI中的幻覺，指的是生成基於事實並且與文脈無關的信息，卻看似真實的現象。

這與簡單的「錯誤（エラー）」，如程式計算錯誤或程式漏洞，質上是不同的。

例如，當詢問「日本首都的歷史」時，AI可能會生成「在江戶時代，首都在京都，但德川家康將大阪定為經濟中心的新首都」這樣的解釋，表面上看似歷史說明，卻完全是虛構的案例。

將這一現象稱之為「幻覺」，是因為它類似於人類的精神作用，暗示了問題的根深蒂固。

與現實的無關性
人類的幻覺是人無客觀刺激感知某些事物，AI的幻覺同樣是在沒有學習資料直接根據的情況下，僅靠內部計算過程生成信息。
堅定的信念
如同親身經歷幻覺的人會堅信其是真實，AI同樣對生成的信息沒有懷疑的自覺。自信滿滿的表達方式與人類的幻覺有很高的相似度。
根植於AI的操作原理的問題
「錯誤」表明系統的表面故障，而「幻覺」則是根植於AI的根本機制。AI並不「理解」詞語的意義，而是從大量數據中預測「在這個詞後，最有可能出現的詞是什麼」的統計模式來生成文本。這種概率鏈接有時會編織出與現實脫節的「看似合理的故事」。

該問題的核心涉及哲學中的「認識論」。認識論是一門探討「知識是什麼」「知道是什麼」的學科。

在哲學的範疇內，「S知道P（S知道P）」這一狀態是如何成立的，這個問題已討論了幾個世紀。

為了成立「知道（knows）」，最有力的假設是「正當化的真信念（Justified True Belief, JTB理論）」。
根據這一理論，「知道」的前提需要滿足以下三個條件。

那麼，我們將AI的幻覺用此框架進行分析。

(1) 真實 → ×
幻覺的內容是「虛假」，因此不滿足第一條件。
(2) 信念 → △
AI是否如人類一樣具有「信念」仍存爭議，但其毫不質疑地輸出生成內容的樣子可以被視為某種「信念」狀態。
(3) 正當化 → ◯（※AI的正當化）
此處是最重要的。
對AI來說，「正當理由」是學習數據內的海量統計模式。「在這個詞後最有可能出現的詞」的計算，便是AI的「正當化」。