
Appleは、機械学習ジャーナルで最新のホワイトペーパーを公開しました。本日のエントリーは「大規模なプライバシーを考慮した学習」で、Appleが差分プライバシーを活用して製品機能を向上させる具体的なアルゴリズムについて解説しています。人気の絵文字の発見といった具体的なユースケースも取り上げています。
Apple は、この夏に開始した機械学習ジャーナルを使用して、Siri の進化、「Hey Siri」の仕組み、顔検出機能などについて情報を共有してきました。
本日の論文では、製品を改善するためにユーザーデータにアクセスすることと、ローカル差分プライバシーを使用してユーザーの情報を保護することのバランスについて詳細に説明します。
差分プライバシーの枠組みには、中央とローカルの2つの設定があります。本システムでは、中央差分プライバシーに必要なサーバー上での生データの収集は行いません。そのため、より優れたプライバシー形態であるローカル差分プライバシーを採用しています[3]。ローカル差分プライバシーの利点は、データがデバイスから送信される前にランダム化されるため、サーバーが生データを見ることも受け取ることもないということです。
Appleはまた、同社のシステムはオプトインのみで透明性が高く、ユーザーの承認なしにデータが記録または送信されることはないと述べている。
この文書では、Apple が使用しているシステム アーキテクチャと、Apple が設計した「Private Count Mean Sketch」、「Private Hadamard Count Mean Sketch」、「Private Sequence Fragment Puzzle」などのアルゴリズムについて詳しく説明しています。
使用例に関しては、Apple は、場所に基づいて予測絵文字 QuickType の提案を改善できると述べています。
ユーザーベース全体で絵文字が人気であることを踏まえ、お客様に最もよく使用されている絵文字と、それらの文字の相対的な分布を把握したいと考えています。そのために、キーボードロケール間で使用されている絵文字の分布を把握するためのアルゴリズムを導入します。このユースケースでは、CMSのパラメータをm m = 1024、k k = 65,536、ϵ ϵ = 4、辞書サイズを2600個の絵文字に設定しました。
データはキーボードのロケール間で多くの違いを示しています。図6は、英語とフランス語の2つのロケールのスナップショットです。このデータを使用することで、ロケール間でQuickTypeの予測絵文字精度を向上させることができます。
その他の使用例には、「Safari での高いエネルギーとメモリ使用量の特定」や「新しい単語の発見」などがあります。
ジャーナルの全文はここでお読みください。
Apple のニュースをもっと知りたい場合は、YouTube の 9to5Mac をご覧ください。
octbo.com を Google ニュース フィードに追加します。
FTC: 収益を生み出す自動アフィリエイトリンクを使用しています。詳細はこちら。