CNN 的限制與改進

一句話理解

CNN 最大問題是用同一組 filter 處理所有位置,但不同位置其實是不同任務。

研究流程(老師強調)

  1. 先看別人怎麼做
  2. 找問題(限制)
  3. 提出改進方法(你的貢獻)

CNN 的核心問題

1. Convolution 限制

  • Kernel size 固定,只能抓固定大小的 pattern
  • 無法適應不同尺寸物體或不同尺度特徵

2. 空間理解問題

  • CNN 擅長局部特徵(local pattern)
  • 不擅長全局關係(global structure)
  • 問題:地圖/網格資料中每個位置語意不同,但 CNN 用同一組 filter 處理

3. 任務混在一起

  • 一張圖中有多個不同區域任務
  • CNN 同一個 filter 做同一件事 → 不適合 multi-task / heterogeneous data

CNN 假設 vs 現實

CNN 假設現實
平移不變性不同位置 = 不同語意
局部感受野不同區塊 = 不同任務

改進方向

  1. 1×1 Convolution:做 feature transformation,增加 channel 學習能力
  2. 區域拆分(Spatial Partition):把圖切成多區塊,每個區塊做不同任務
  3. 多尺度處理:使用不同大小的 receptive field

MMSAI2 | 訊號處理與Spectrogram | 資料類型與對應模型 | CNN