「個資利用與去識別化」是針對政府為公共利益之必要,發佈統計資料、提供學術研究時,採用「遮除、概略化、亂數化」等資訊技術,以充份保障個人資料及隱私權、增進公眾互信的架構。實務上的建議,可簡列如下:
- 機關儲存源資料時,可將識別符代碼化以增進資訊安全。
- 此處「代碼化」必須為不可逆運算,但可結合密鑰為之。
- 代碼化後之資料仍然含有有隱私與個人資料,因此不應稱為「去識別化資料」。
- 機關應容許資料當事人申請註記為「排除特定目的外之利用」。
- 為統計取樣之必要,或向不特定公眾提供含任何個資之資料集時:
- 應以「任何人(含原資料持有人)皆無從識別」為判準,釋出合成資料。
- 為學術研究之必要,向特定研究者提供含特種(敏感)個資之資料集時:
- 應以「資訊專家亦無從識別」為判準,按實際需求,採「資料最少原則」提供。
- 為學術研究之必要,向特定研究者提供無特種(敏感)個資之資料集時:
- 應以「有心侵入者無從識別」為判準,按實際需求,採「資料最少原則」提供。
- 機關可將代碼化後之資料,委託第三方機構執行下列事項:
- 將資料充份去識別化處理後,向特定研究者揭露。
- 製作「任何人(含原資料持有人)皆無從識別」之合成資料。
- 事後註記為「排除特定目的外之利用」者:
- 機關應結合密鑰計算其代碼,使第三方機構刪除相應資料。
- 機關不得將代碼化密鑰交予第三方機構。
- 概略化、亂數化技術之參數值應由個案討論訂定。
- 下圖列出對應各專業層級的侵入者,可採用的去識別化方法。
- 多項方法可以施用於同一資料集,例如身分證字號採代碼化、ICD-9 值一律遮除、出生年月日概略化、最後再採取亂數化處理。