
世界ではあらゆるデータが日々巨大化し、それらを斬新な手法で効率化する最先端技術フェデレーテッドラーニング(Federated learning)が、いま大きくクローズアップされています。
そこで今回はフェデレーテッドラーニングの概要や利点、具体的な導入例や使用方法も含め、詳しくご紹介いたします。
フェデレーテッドラーニングとは?
フェデレーテッドラーニングは、2017年にIT大手のGoogleが発表した機械学習の1つです。
日本語で「連合学習」という意味があります。フェデレーテッドラーニングは多様なデータを一か所に集めることなく、分散した状態のまま任意のAIや端末を機械学習することができる画期的な技術で、現在さまざまな分野で導入が進んでいます。
従来の機械学習では個々に分散するデータを1箇所に集めて学習を行う必要があり、機密データの取り扱いや変換の方法、通信量の増大などで、開発が思うように進まないケースがありました。
しかし、連合学習では常に大量のデータをやり取りせず、各端末が個々に機械学習を独自に実行して改善点を探すことができるため、負荷が少ないスムーズな開発環境を実現可能です。
フェデレーテッドラーニングの利点
新製品を効率的に開発できる
フェデレーテッドラーニングは任意の端末にコアプログラムをダウンロードするだけで、すぐに機械学習を開始できるため、従来の機械学習よりもずっと効率的に、開発中のAIや端末を教育することができます。
プライバシーの保護が容易になる
大量のデータをオンライン上で相互にやり取りする機械学習では、開発の過程で個人情報を含むデータが送信され、プライバシー情報が漏えいする危険がありました。
しかし、フェデレーテッドラーニングでは機械学習した結果やプロセスのみをコアデータから切り離して送信できるため、個人データが守られ、プライバシーの保護が容易になります。
機密データ漏洩のリスクが少ない
従来型の機械学習では開発段階での企業秘密など、重要データの保護が課題でした。
しかし、フェデレーテッドラーニングなら、重要データを社外のクラウドサーバへ送信せずに開発を進めることができるため、機密データの漏洩リスクが少なくなります。
膨大なデータをそのまま取り扱える
機械学習では、様々なデータをデータセンターで一括管理しながら膨大な個別データを収集して蓄積し、機械学習に適したデータに変換する、といった複雑な前処理があります。
しかし、フェデレーテッドラーニングならデータ整形の前処理が不要であり、膨大なデータを変換することなく、分散させたまま機械学習させることが可能なのです。
フェデレーテッドラーニング導入に必要な準備
フェデレーテッドラーニングのコアプログラム
フェデレーテッドラーニングの導入時には、TensorFlow(テンソルフロー)と
フェデレーテッドコアといったコアプログラムが必要です。
TensorFlowは、グーグルが開発した機械学習、数値分析、ディープラーニングなど、さまざまな技術に対応したオープンソースのソフトウエアライブラリです。誰でも配布や実行、改変が可能です。
フェデレーテッドコアは、フェデレーテッドラーニングに特化したコアプログラムであり、フェデレーテッドコアをTensorFlowに組み合わせる事で、フェデレーテッドラーニングの導入が可能になります。
自社に合わせてカスタマイズできる技術者
フェデレーテッドラーニングの実行には、フェデレーテッドコアを自社仕様に合わせる関数プログラミングを主体としたカスタマイズが必須です。
そのため、フェデレーテッドラーニングを導入する場合は、これらをクリアできる開発技術者を確保しましょう。
フェデレーテッドコアは、オープンソースなのでカスタマイズに制限がありません。開発技術者のスキルによって、用途の幅は大きく変わります。
フェデレーテッドラーニングの導入事例
スマホの学習に使う
Googleは、スマホ(Android 10)の学習アルゴリズムにフェデレーテッドラーニングを取り入れています。
スマホにダウンロードされた機械学習プログラムを実装し、スマホの動作で問題が見つかれば、結果とプロセスのデータを元に修正プログラムを追加する事で、動作の改善が完了します。この方法ならばスマホの個人情報データは不要であり、機械学習の利点を維持しながらプライバシーの保護も可能になります。
創薬や医療用AIの教育に応用する
医療機関ではさまざまな症例データを医療用AIに機械学習させ、相互連携を図ることで医療技術を向上させる取り組みが盛んです。しかし、そこで問題になるのが患者のプライバシー漏洩や膨大なデータ送信時の負荷です。
フェデレーテッドラーニングでは、各医療機関の膨大な患者データを匿名のまま活用しつつ、医療用AIを安全でスムーズに機械学習させるアルゴリズムの構築が可能です。
海外では乳がんや脳腫瘍など画像解析用AIの機械学習で、現在技術開発が進み、
また、創薬業界でも同様にフェデレーテッドラーニングの導入が検討されています。
例えば、欧州の製薬会社10社に加え、科学アカデミーやIT業が共同参画したMELLODDY(Machine Learning Ledger Orchestration for Drug Discovery)というプロジェクトでは、機密性を維持しながら多様な薬剤データを共有化し、創薬系AIを効率的にトレーニングするアルゴリズムの開発が進んでいます。
銀行や保険業務に応用する
銀行業界はモバイルバンキングやネットバンキングの普及により、支店の統合やATMの廃止、預金の管理法など、大規模な業態変革が求められていますが、それに伴う基幹システムの不備や、預金者データの漏洩が大きな社会問題になっています。
そのような課題を克服すべく、インテルとData Republicは共同でフェデレーテッドラーニングを応用した新しい金融サービスの開発を発表しています。その内容は複数の銀行をクラウドネットワークで繋ぎ、膨大な金融データをローカル環境(外部遮断環境)に保持したまま共有化し、機械学習で個別の金融データをさまざまに分析し、改善点を探ります。
この方法なら金融データの利用価値を最大限高めつつ、機密保持もできますので、利用者の利便性向上に加え、マネーロンダリングなど、組織犯罪の摘発も期待されています。また保険業界でも銀行と同じ様に、保険料の入金、保険金の出金、顧客情報の管理方法など、保険に関する膨大な事務作業があり、不正請求の洗い出しも含めて、フェデレーテッドラーニングの導入が検討されています。
データを制する者が世界を制す
デジタル革命が叫ばれて久しいですが、とりわけビッグデータをどう利用して、どの様に効率化するかが、構造変革の鍵になると言われており、「データを制する者が世界を制す」時代が目前に迫っています。フェデレーテッドラーニングはその草分けとなる最先端技術です。
巨大なビッグデータ同士が1つに繋がり、世界共有化される日は近いでしょう。