日時 2015年10月28日(水)18:30~20:30
場所:東洋大学白山キャンパス5号館1階5101教室
司会:山田肇(東洋大学経済学部教授、ICPF理事長)
講師:株式会社UBIC コーポレートコミュニケーション部 部長代理 水口ひとみ氏
株式会社UBIC MEDICAL 営業部 営業マネージャー 江後大樹氏
講演資料はこちらにあります。
水口氏と江後氏は講演資料に基づいて概略次の通り講演した。
- UBICは、2003年8月にCEOの守本正宏氏によって設立され、米国訴訟支援事業を中心にビジネスを展開してきた。人工知能技術を、その間に蓄積したノウハウと独自技術により発展させ、未来予測に優れるビッグデータ解析技術を開発した。適応分野を拡大することで独自の社会貢献を目指している。
- 拠点は日本の他、米国、韓国、台湾とグローバルである。米国では、2013年にナスダックに上場している。2014年には、ワシントンD.C.のディスカバリ企業であるTechLaw Solutionsを完全子会社化し、2015年にサンフランシスコのディスカバリ企業であるEvDを完全子会社化している。外国籍比率が70%とグローバルな環境となっている。
- 米国での訴訟では、原告と被告ともに自ら保有する膨大な資料(eメールや電子文書など)の中から必要な証拠を見つけだし、裁判所に提出するディスカバリという手続きがある。そのためには、テキストを効率よく解析する技術が必要である。
- 証拠は、自分たちで提出しないといけないのが米国独特のルールである。大量の電子メール、電子書類の中から証拠となるものを探さなくてはいけないため、米国のリーガル産業は、ハイテク産業であると言ってもよい。法律事務所から委託されたITベンダーが膨大な資料から証拠となるものを探し、抽出した資料を弁護士がチェックし、証拠かどうか最終判断をするという仕組みである。
- 人工知能を利用した国際訴訟支援では、膨大な量の対象データから一部をサンプルとして取り出し、弁護士にこれが証拠になるか、ならないかを判断してもらう。この弁護士による仕訳の教師データを人工知能が学習して、残りの膨大な資料を、弁護士の判断基準に合わせて、人の4000倍の速さで重要度順に並び替える。弁護士本人の判断基準で選択するので、弁護士も納得できる抽出となる。検索キーワードではなく、文脈の違いで検索できることが特徴である。
- 上記のようなディスカバリの他に、日本の法執行機関への導入事例もある。捜査資料等を外部機関が預かることはできないので、ツールとして販売している。
- 国際訴訟支援に加えて、企業の第三者委員会の調査案件に利用していただいた事例や、人工知能を活用したメール監査ツールの企業への導入など、1400件以上の実績がある。年初のNHKスペシャル「NEXT WORLD」第1回では人工知能の企業としてIBMやグーグルなどと並んで、日本企業として1社だけ紹介された。
- UBICが特化しているのは、自由に記載されたテキストデータの解析である。キーワードや概念検索ではなく、人の暗黙知や感覚、嗜好を学ぶことで、大量のデータの中から見つけ出したいデータを探し、優先順位をつける。人工知能を利用するメリットは、少量の学習から大量のデータを判断できることにある。また、判断の継続性・精度の維持、人間の行動や判断の特徴を捉える、専門家の業務をサポート、一般ユーザの感覚を学ぶといったメリットがある。
- 新領域での取り組みに乗り出している。病院内における「転倒・転落防止システム」がその一例である。電子カルテのテキストデータは病院にたくさんあるが、忙しい医師がデータの解析をするのは困難であり、時間を要すれば患者に向き合う時間が減ってしまう。従来は入院患者の転倒リスクに対して、アセスメントやセンサーといったもので対応してきたが、転倒リスクをタイムリーに把握し、患者・医療スタッフに負担感が少ない技術が必要とされている。
- NTT東日本関東病院との共同研究では、電子カルテ100名分16749件から、安全管理のエキスパートである医療安全管理室勤務の看護師に、転倒の予兆となる意識障害の症状がある患者のデータ17件(7名分)を選んでもらった。その他のデータとして、上記の7名以外のデータから1000件をランダム抽出し、この1017件を教師データとして学習させた。これを元に、すべての電子カルテを0~10000点でスコア付けすることができ、優先順位をはっきりさせることができた。スコアの高い約1000件に注意力の低下や意識障害などの症状がみられ、効果が検証された。
- マーケティング分野では、デジタルキュレーションサービスを試みている。これは、「あなただけの人工知能」をコンセプトにしたサービスとなっている。一般に、本を買ったり、レストランに行く際にはレビューを参考にすることが多い。Amazonでは、購買履歴から「あなたが買った本を買った人は、ほかにこんな本も買っている」といったリコメンドをしてくれるが、このような既存技術・サービスでは、細かい個人の好みを反映できていなかった。定量的な情報を用いたありきたりなおススメにより、ユーザがサービスに飽きてしまうこともある。
- 人工知能によるユーザの好みを理解した提案は、まったく違うアプローチをとっている。評価点数や購買・行動パターンではなく、多数の人が意思を持って書き込んだコメント群を人工知能で分析することで、その人の好みにあった商品・サービスをリコメンドできる。例えば、自分のよく知っている九州のホテルで教師データをつくる。この教師データで、海外のすべてのホテルサイトのレビューを分析すると、私の判断基準で好みのホテルを見つけてくれる。自分では気がつかなかったけれども好きであろうもの、驚きを含んでいるが自分の好みから外れていないものを抽出するといったことができる。
- ビジネス支援の領域でも人工知能を搭載したソフトウエアの提供を開始した。電話によるコミュニケーションが主流であった以前の職場環境であれば、部下が電話で話しているのがなんとなく聞こえてきて、その内容から「トラブルになりそう」、「ビジネスチャンスになりそう」ということがわかった。現在は、電子メールやSNSでのやり取りになっているので、自分の部下が取引先などとどんなやり取りしているかわかりにくい。
- 管理・監督者の暗黙知から教師データを作成すれば、チームメンバーの電子メール・電子文書の中からビジネスチャンスやビジネスリスクにつながる情報を検知し、お知らせしてくれるようになる。例えば、マーケティング部門の担当者が、コールセンターの顧客対応履歴データの中から、「商品開発のヒント」や「クレーム」といった予兆を検知できるように支援する。
- 経済産業省から2015年7月の子どもデーに出展のお誘いをいただき、人工知能を子供が体験できる「人工知能がおすすめ!あなたがきっと好きな本」をブース出展した。好きな本を選ぶと、人工知能がその子の好みにあった本を提示してくれる。7月29、30日の2日間で会場に2180名の参加があり、気づきの多いイベントになった。
- 医療にフォーカスして、専門子会社「UBIC MEDICAL」を2015年4月に設立している。NTT東日本関東病院との共同研究プロジェクトやAMEDの公募事業などを進めており、今後は、治験情報の解析支援サービス、薬剤監視サービス、メンタルケア支援データ解析サービスといった事業にも拡げていきたい。AMEDの公募事業では、慶応大学やアドバンスト・メディア、システムフレンド、セムコ・テクノ、ソフトバンク、日本マイクロソフトといった企業との共同で、精神疾患患者における重症度の客観的評価を行えないかという研究を行い、4年かけて製品化の予定である。
- エムスリー株式会社との協業で、医薬品の販売で副作用調査を実施することも発表している。途上国でも、副作用調査が必要になってきており、実際の副作用と疑わしいものを判断して、厚労省に報告できるように支援するものである。
- トヨタテクニカルディべロップメント(TTDC)と、特許出願のための調査業務の負担を軽減する知財評価ツールを共同開発した。こちらは、年内に発表予定である(2015年10月29日提供開始)。また、デバッグのサービスを提供するハーツユナイテッドグループと協業を開始している。スーパーデバッカーと言われるような人は、プログラムを眺めているだけで、バグを発見する。この暗黙知を人工知能に学習させ、IoT時代のニーズに応える。最近は、サイバーセキュリティの面からも、開発したプログラムに穴がないかをきちんと確認したいというニーズがある。
講演後、以下の事項について質疑があった。
個人情報保護と利用規約
Q(質問):子供たちがデジタル教科書を使うと、同じ教室の中でも、ひとりひとりの進捗ごとの授業が可能となる。それに加えて、図書館で子供が何の本を借りているかがわかれば、もっと個人の嗜好にあった教育が提供できるはずだ。しかし、図書館には自由を守るという原則がある。思想の管理にもつながる恐れがあるセンシティブな個人情報(閲覧記録)を利用することは抵抗がある。UBICの事業では、個人情報の取り扱いはどうなっているのか?
回答(A):UBICがマーケティング分野の事業を行う際には、パートナーとして、ECサイトなど個人情報を取得する事業者と組むことになる。その事業者が提供するサービスを利用する段階で、個人情報の利用に関する許諾をもらうことになる。
Q:利用規約は長くて細かいので通常は読まない。消費者に明らかに不利な内容があれば、それは利用規約として認められないというように民法改正しようという動きもある。
A:ECサイトの場合は、購入することが前提で利用者はサイトにアクセスしているので、基本は「おすすめされたい人たち」となり、あまり問題にならないのではないかと感じる。公共のデータを利用する場合には、個人情報の取り扱いの問題がでてくると思われる。
コメント(C):利用規約自体をAIにかければ、おもしろい結果がでるのではないか?
人工知能技術について
Q:グーグルで名前を検索したら、全く関係のないものと関連付けられていた。グーグルに文句をいうと、「機械がアルゴリズムでやっているので、なぜかわからない」と回答されるという話があった。こういうことはあり得るのか?
A:なぜ人工知能がそういう判断をしたか理由を説明するのは難しいと言われている。電通国際情報サービスとの共同開発では、例えば、スターウォーズが好きというデータを教師データにすると、クロサワの映画がリコメンドされる。クロサワに興味がなくても、映画を見てもらえれば「クロサワの映画もいいね」ということになる。「なぜクロサワ?」に対して、例えば「ジョージ・ルーカスがクロサワをリスペクトしていたから」という理由があれば、リコメンドされた人もとっつきやすいといえる。
C:クロサワを見なかったら、教師データに「見なかった」というデータを入れて再計算すればいいのではないか。
C:人間の判断の多くは間違えであると言われている。クロサワを選ばなかったことが間違いということも多いはずである。
A:人工知能で解析しても、最終的には人が選ぶ。国際訴訟であれば、弁護士を支援するものである。ホーキング博士のような著名人の一部から「人工知能が人間を超える」という脅威論がでているが、当社の人工知能は、人間の判断基準を学んで支援するというのがコンセプトである。
Q:ニッサンがハンドルのない車をだした。人間がどう危険を回避しているかの知見を利用していると思うが。自動運転の中で、自分がブレーキを踏むか踏まないかの判断ができるのか?
A:どこまでの精度が求められるかということになるが、これは活用分野によるところもある。リーガルやメディカルは精度を求められる。一方、マーケティングは100%の正解を求めるよりも、個々人の嗜好に合うかどうかといったことだ。
C:米国では、自動運転のリスクは保険でやればいいという話しもあるが。
Q:医療分野の事例であった転倒リスクでは、人工知能の解析結果を最終的に医師が判断するのか?
A:その通りである。患者にどんなケアをするのか、どこに人員を配置するのかといったことは、現場の人間、医師や看護師の判断になる。あくまでも補助である。解決したいという思いがある医療従事者がUBICと組んでくれている。そもそもリスクが高い環境なので、それをどう軽減するかという中での、UBICの支援となっている。現場が受け入れていただけるものを優先的に取り組んでいる。
新しい応用の可能性
Q:著作権コンテンツ、過去のテレビや映画のコンテンツの評価方法として使えないのか?
A:映画の脚本などのテキストがあれば利用できる。過去に視聴率が高かったドラマを判断基準として抽出してくるということは可能であろう。
Q:医療分野への進出の課題は?
A:医療分野はコンサバティブな人が多く、病院で教師データを作るのはなかなか難しい。厚労省も国立病院のデータを集めようとしているが、病院ごとにメーカーが違って、データが活用しやすい形式で集められていない。活用しやすいようにモディファイすることが、患者さんのためになる。
C:日本でこういう技術が開発されたのはよいことと思う。日本では消費者の立場にたった議論ができていないため、ITリテラシーのない人が便利だからと、自分の情報をどんどんと入力してしまい、気づいたら、消せなくなっているということもある。ITリテラシーのない人は、歯止めがわからない。人工知能の解析で、サーバーポリス的に、ここからは危ないよと教えてくれれば、安心して利用できるのではないか。
C:僕はネットを積極的に利用すべきと思っているが、過剰に依存するのはよくない。現在の子供向けのインターネットフィルターが機械的なブロッキングが行われている。教育者の教師データで、子供たちとっても苦にならないものができそうである。
Q:人工知能の提供方法は、エンジンをライセンス的に提供しているのか?
A:アプリケーションにして販売するものもあれば、協業の場合には、協業先のシステムに組み込んだりする。リーガルの場合は、膨大なデータ量なのでクラウドサービスを提供し、ホスティング料やコンサルティング料でお金をいただいている。製品として購入してもらい、トレーニング料・コンサル料をいただくケースもある。eメール監査はクライアントのID数での価格となっており、一律の料金体系ではない。
Q:データ分析の機能を売るには相手の暗黙知が重要で、UBICにこれが蓄積されていく。暗黙知を横展開、ほかのドメインに持っていくということはしているのか?
A:メール監査ソフトウエアには、ナレッジベースを搭載している。海外公務員への賄賂、カルテルなどの場合、このような事案は急に起きるのではなく、その前段階がある。心理学、犯罪学などの行動科学の面からもモデリングする。このナレッジベースにより、カルテルの経験のない会社でも、まずはUBICのソフトウエアで解析することが可能で、そのあとに人工知能が再学習すればよい。
Q:こういう分野の技術者を大学で育てる場合、機密情報である企業の実データを大学で使うことはできないので、人材育成できないのではないか?
A:人工知能の研究者は、アカデミックでも育てられる。人工知能には冬の時代があり、研究者は、今は引く手あまたである。ただし、特定のビジネスドメインに提供される技術の研究は大学では難しいのでここは企業がやらないといけない。UBICの研究開発陣は、哲学出身のCTOをはじめ、素粒子物理の元研究者、4か国語を話す計算言語学者など多様な人材がいる。
C:大学では、人工知能を利用しようとする先生方は多い。銀行での異常行動から認知症患者を検知できる、児童相談所に児童虐待のデータが紙でたくさんあるが、これをデータして分析しようという話もでてきている。
Q:大学の先生がUBICと共同でやりたいといえば、筋がよければ一緒にやってもらえるのか?
A:まずは、UBICの技術が役に立つのかを無償で実験するProof of Conceptという段階がある。ここで芽があるとわかれば、有償の運用フェーズとなっていく。PoCなら人工知能の実験は、パソコン1台でできる。
Q:学習塾では、アルバイトの大学生が教えていることが多いが、教える人が少なくなっており、AIによる学習アドバイスが注目されてきている。できない問題を入力すると次にやるべき問題用紙がでてくるといった個別化対応は結構進んでいる。長く教えている先生で、教え方もうまくて、子供気持ちもわかる先生の知見をAIにすれば、これが先生になるのではないか?
A:教育分野はご相談が多く、個別化対応が得意な当社の人工知能には可能性がある。人工知能によって、弱い部分をアドバイスできるようなものになると思われる。