契機是正式導入了 AI 與 Python。
過去那種「決定主題 → 收集資料 → 分析」的研究流程,已經完全成為過去式。
現在是:
先建立資料基礎建設,用 AI 大量產生假說,再用 Python 高速驗證。
靠這三個步驟,研究就能「運轉」起來。
而且令人驚訝的是,假說的驗證在 30 秒內完成也並不罕見。
本文將以實例與程式碼片段,介紹
AI 時代研究風格如何改變、以及 為何研究能像遊戲一樣進行。
過去通常是
決定主題 → 收集資料 → 分析
的順序。
但現在反過來,
先建立資料基礎建設 反而效率極高。
# 範例:從日本氣象廳 API 自動取得
import requests
import pandas as pd
url = "https://www.jma.go.jp/bosai/quake/data/list.json"
df = pd.DataFrame(requests.get(url).json())
df.to_parquet("earthquake.parquet")
一旦建立起來,
資料取得 → 假說 → 驗證
的迴圈就能無限次地運行,成為一個「實驗工廠」。
過去多是
研究者的直覺 → 一個假說 → 驗證
的流程。
但使用 AI 後,
一次會產出 10~50 個假說。
請列出這個時間序列資料中異常值的 10 個可能原因
AI 會馬上回覆:
會出現人類單靠自己絕對想不到的假說。這是 AI 最大的強項。
把驗證假說的程式模板化後,
假說 → 執行程式 → 統計檢定 → 結果
可以在數十秒到數分鐘內完成。
# t 檢定範本
from scipy import stats
result = stats.ttest_ind(groupA, groupB)
print(result)
結果:
這些在 30 秒內就會發生。
一開始會很震驚,但現在反而覺得 這速度很有趣。
例如:
假說:地震的深度有特定分佈?
→ 統計檢定
→ 無再現性
但這是健全的。
科學本質上就是不斷重複:
假說 → 驗證 → 否定
的過程。
過去的研究是
對單一假說深入挖掘。
現在則是,
在假說空間中探索。
不斷循環這個流程。
由於假說的提出、驗證、淘汰速度都很快,
研究進程變得 像玩遊戲一樣。
可以不斷重複這個流程數十次、數百次。
AI 的角色:
人類的角色:
這樣的角色分工最為強大。
仍在不斷試錯中,但我覺得這種方式是 讓研究變得十分有趣的方法。
如果你是: