t-SNE
一句話理解
用高斯計算原空間相似度,再用 t 分佈在低維重現,把遠的推更遠、近的拉更近。
解決的問題:Crowding-Problem
核心流程
- 直接投影 → 擁擠,BCD 重疊
- 用高斯分佈計算原空間各點相似度
- 低維改用 t 分佈(重尾) → 遠的推更遠
- 結果:各點清楚分開
t-SNE vs PCA-vs-LDA
| 比較 | t-SNE | PCA |
|---|---|---|
| 效果 | 目前最好 | 線性,較差 |
| 一致性 | 每次不同(隨機初始化) | 每次相同 |
| 距離意義 | 無 | 有 |
常見錯誤
t-SNE 降維概論後群的大小、群間距離完全無意義,只看群的分離程度。