CNN 的限制與改進
一句話理解
CNN 最大問題是用同一組 filter 處理所有位置,但不同位置其實是不同任務。
研究流程(老師強調)
- 先看別人怎麼做
- 找問題(限制)
- 提出改進方法(你的貢獻)
CNN 的核心問題
1. Convolution 限制
- Kernel size 固定,只能抓固定大小的 pattern
- 無法適應不同尺寸物體或不同尺度特徵
2. 空間理解問題
- CNN 擅長局部特徵(local pattern)
- 不擅長全局關係(global structure)
- 問題:地圖/網格資料中每個位置語意不同,但 CNN 用同一組 filter 處理
3. 任務混在一起
- 一張圖中有多個不同區域任務
- CNN 同一個 filter 做同一件事 → 不適合 multi-task / heterogeneous data
CNN 假設 vs 現實
| CNN 假設 | 現實 |
|---|---|
| 平移不變性 | 不同位置 = 不同語意 |
| 局部感受野 | 不同區塊 = 不同任務 |
改進方向
- 1×1 Convolution:做 feature transformation,增加 channel 學習能力
- 區域拆分(Spatial Partition):把圖切成多區塊,每個區塊做不同任務
- 多尺度處理:使用不同大小的 receptive field
MMSAI2 | 訊號處理與Spectrogram | 資料類型與對應模型 | CNN