考量個人資料與隱私保護,我們建議去識別化採取以下的判準:
- 個人行為紀錄,藉由連結其他資料集而能間接或直接識別當事人時,該紀錄即屬於個資。
- 除資料當事人擁有隱私權外,也應防止有心者藉由資料推導,使特定族群蒙受干擾。
- 因此,個資法所稱研究、統計之必要,於去識別化時,應採「資料最少原則」滿足之。
- 技術上任何可逆之編碼方式,不應稱為「代碼化」。
- 結合密鑰之不可逆編碼方式,可以稱為「代碼化」。
- 代碼化處理後之資料仍可間接識別,因此不應稱為「去識別化」。
- 供不特定人利用之開放資料,應依資訊含量,分級選擇去識別化方式:
- 資料筆數不足以充份執行去識別化運算者,考量重新識別之風險,應遮除所有直接、間接可識別欄位內容。
- 資料筆數足以進行去識別化運算者,可採樣建立「任何人(含原資料持有人)皆無從識別」之合成資料集,以供分析使用。
- 供特定學術研究者使用之資料,應依資訊含量,分級選擇去識別化方式:
- 資料筆數不足以充份執行去識別化運算者,以及特種敏感個資,應以「資訊專家亦無從識別」為判準提供。
- 資料筆數足以進行充份亂數化或概略化運算、且為非特種敏感之個資,得以「有心侵入者無從識別」為判準提供。