データ匿名化のGretelがシリーズAで12.5億円調達
AI.
企業がデータを扱う中で、直面する大きな問題の1つは、個人を特定できる情報(PII)やその他の機密データが決して流出しないようにすることだ。通常、その種のデータを取り除くには丹念な手間のかかる手作業が必要だ。アーリーステージスタートアップのGretel(グレーテル)は、データセットの匿名化をより迅速かつ容易にすることで、その状況を変えたいと思っている。米国時間11月16日、同社はGreylockが主導する1200万ドル(約12億5000万円)のシリーズAを発表した。これによって、同社は現在までに合計1550万ドル(約16億2000万円)を調達した。
Gretelの共同創業者でCEOのAlex Watson(アレックス・ワトソン)氏は、彼の会社は、データの匿名化をよりシンプルなものに変え、これまではプライバシー上の懸念のために手の届かなかったデータセットを利用可能にするために創業されたのだという。
「開発者として、アイデアをテストしたり、新しい機能を構築したりしたいと考えたとします。その場合、必要なデータにアクセスするには数週間かかることがあります。基本的には、始めるための様々な承認をとりつけ、そしてデータベースのスナップショットを取得し、その後手作業で個人データと思われるものを取り除き、必要なものが全部手に入ったことを祈ることになります」。
以前AWSでジェネラルマネージャーとして働いていたワトソン氏は、データを匿名化するための、より迅速かつ信頼性の高い方法が必要であると信じていた。それがGretelを始めた理由なのだ。その最初の製品は、開発者向けの個人を特定できる情報を取り除くオープンソースの合成機械学習ライブラリだ。
「開発者は、機械学習モデルをトレーニングする私たちのオープンソースライブラリを、機密データに対して利用します。トレーニングが行われていく際に、私たちは差分プライバシー(differential privacy)と呼ばれるものを強制していきます。これは基本的に、データ内部にある個人の秘密情報の詳細を、モデルが記憶しないようにするものです」と彼はいう。その結果、匿名化され、業務全体で安全に共有できる新しい加工データセットが作成されることになる。
同社は2019年に創業し、今年は実際にオープンソース製品を開発し、その周囲にオープンソースコミュニティを構築するために費やされた。「なので、私たちのアプローチと市場投入戦略は、基盤となるライブラリをオープンソース化し、同時に合成データと匿名化データを簡単かつ大量に生成できるSaaSサービスを構築することなのです」と彼はいう。
創業者たちはこの会社を成長させていく中で、どのようにすれば多様で包摂的な組織を生み出すことができるかを、定例経営会議で検討してきた。特に彼らは、今回の投資資金を使ってシニア人材の雇用を始めることを検討している。
「私たちは、多様な候補者に応募していただき、実際に彼らと会話を行うことができるように、意識的に努力しています。それは報われるでしょう。あるいは現在採用プロセスの中の候補者たちの顔ぶれから、報われようとしている最中ですと言ってもよいでしょう。だから私たちはとても楽しみにしているのです。しばしば陥りやすい、均一思考を避けることはとても重要なことです」と彼はいう。
現在同社には有料顧客はいないが、設計パートナーとの関係を築き、2021年からは収益を引き出すことを計画している。投資をリードしているGreylockのパートナーであるSridhar Ramaswamy(スリーダー・ラマスワミー)氏は、このようなサービスに大きな可能性を見ているので、彼の会社は収益を挙げる前の会社に賭けているのだと語る。
「Githubがソースコードのアクセスとコントロールを一般化したように、わたしたちはGretelが世界中のデータへの安全で制御されたアクセスを一般化すると考えています」とラマスワミー氏は述べている。
関連記事
・絶滅危惧種など画像が少ないケースでも合成データでAIを訓練するSynthetaicが4.7億円を調達
・元NSAとAmazonのエンジニアが「データのGitHub」を開発中
カテゴリー:ネットサービス
タグ:Gretel、匿名化、資金調達
画像クレジット:MR.Cole_Photographer / Getty Images
[原文へ]
(翻訳:sako)
引用先はこちら:データ匿名化のGretelがシリーズAで12.5億円調達