YerbaBuena: Securing Deep Learning Inference Data via Enclave-based Ternary Model Partitioning

paper

  • (2019)
  • Gu Z Huang H Jialong B Bytedance Z Su D Jamjoom H Lamba A Pendarakis D Molloy I

Abstruat

パブリッククラウドにディープラーニング(DL)モデルを配備してサービスを提供することで、人工知能(AI)サービスのブートストラッププロセスが容易になります。しかし、ほとんどのサービス・ユーザーにとって、機密性の高い入力データの機密性を維持することは依然として懸念事項です。ユーザーの入力データが誤って開示されると、ますます厳しくなるデータ保護規制に違反し、評判を落とす可能性がある。本論文では、ディープラーニング画像分類パイプラインにおける入力データのライフサイクルを系統的に調査し、情報開示の可能性のある場所をさらに特定する。発見された洞察に基づいて、ユーザの入力データの機密性と完全性を保護するためのエンクレーブベースのモデル提供システムであるYerbaBuenaを構築する。今日のエンクレイブ技術の性能と容量の制限に対応するために、サービスユーザがローカルマシン上で独自のDLモデルを安全に分割することを可能にする三元モデル分割戦略を採用している。そのため、(I) 機密性の高い計算を安全なエンクレイブに囲い込み、入力情報の開示を軽減し、(II) 機密性の低いワークロードをエンクレイブの外で実行するように、ハードウェア支援のDLアクセラレーションに委譲することができます。我々の包括的なパーティショニング分析とワークロード測定により、ユーザがモデルに最適なパーティショニングを自動的に決定し、低い性能コストで機密性保証を最大化する方法を実証しています。

Summary

  • 機械学習を利用したサービスは個人情報の保護が懸念
  • Enclave領域は限られているので機密性の高い計算を TEE Enclave領域内部で計算
  • 機密性の低い計算はGPUとか使いたいので外部で