Privacy-Preserving Machine Learning (PPML)
データを暗号化したまま機械学習の推論・学習を行う技術。秘密機械学習とも。法規制や倫理でクラウドに生データを渡せない医療・金融分野が主な動機。
アプローチ
- FHE ベース: モデルもデータも暗号化したまま順伝播。非線形(活性化関数)は多項式近似で代替、または TFHE の programmable bootstrapping で正確に評価。
- MPC ベース: 特殊関数も扱えるが、関数を論理回路に落として複数サーバで通信しながら計算するため通信・計算コストが大きい。
- ハイブリッド: 線形層は HE、非線形層は MPC(Garbled Circuit)に分ける Gazelle が代表。
主な成果
- CryptoNets(2016): 学習済み NN を暗号化データに適用する草分け。MNIST で 99% 精度、1 PC で時間あたり約 59000 予測。
- nGraph-HE2: 暗号化データ上の NN 推論を高スループット化するコンパイラフレームワーク。
- Secure Outsourced Matrix Computation: 行列を対角エンコードして NN の行列積を効率化。
- Tile Tensors: 大規模 NN のテンソルを暗号文タイルに敷き詰めるフレームワーク。
- Logistic Regression: 暗号化データ上のロジスティック回帰学習(low-depth 回路設計)。
- Apple Ecosystem: 端末側の ML と HE を組み合わせる実用例。
課題
- 暗号文の乗法的深さ制約で深いネットが組みにくい。
- mask / 回転が平文比で高価。データレイアウトと SIMD batching の工夫が性能を左右する。
- パラメータ選択(精度 vs 速度)の難しさ → FHE コンパイラで自動化。
関連: ckks-scheme(固定小数点で ML 向き)。関連クラスタ: _moc-crypto