Crowding Problem(擁擠問題)

一句話(考試必背)

高維資料的局部結構太豐富,但低維空間容量有限,無法完整保留原本距離,資料點在低維視覺化中被壓縮擠在一起。

原因

  • 高維空間自由度極高(100 維有非常多方向可分散)
  • 降到 2D 後,所有點只能放在平面 → 高維鄰居全部擠在一起

t-SNE 的解法

使用 Student’s t-distribution 重尾分布 → 中遠距離的點被推更開 → 緩解擁擠。

相關

t-SNE / 降維概論 / ISOMAP