t-SNE

一句話理解

用高斯計算原空間相似度,再用 t 分佈在低維重現,把遠的推更遠、近的拉更近。

解決的問題:Crowding-Problem

核心流程

  1. 直接投影 → 擁擠,BCD 重疊
  2. 用高斯分佈計算原空間各點相似度
  3. 低維改用 t 分佈(重尾) → 遠的推更遠
  4. 結果:各點清楚分開

t-SNE vs PCA-vs-LDA

比較t-SNEPCA
效果目前最好線性,較差
一致性每次不同(隨機初始化)每次相同
距離意義

常見錯誤

t-SNE 降維概論後群的大小、群間距離完全無意義,只看群的分離程度。

相關

Crowding-Problem / PCA-vs-LDA / 降維概論