生成AIで業務を安全に効率化!プライベートLLMの導入方法とは?
IT業界のみならず、様々な業界でAIの活用が進められていますが、ここ1、2年でChatGPTなどの生成系AIが注目され始めており、使ったことのある人も多いのではないでしょうか?
生成AIでは2023年に発表されたChatGPTが特に有名ですが、企業での使用については効率化などの面で肯定的に捉えられている反面、セキュリティ面において社内情報の漏洩などが危惧され、利用については踏みとどまっている企業も少なくないでしょう。
今回は、そのデメリットを解決しうる、社内のみで使用でき、情報漏洩を防ぐことが可能なプライベートLLM(プライベートAI)について解説します。
目次
LLM(大規模言語モデル)とは?
「生成AI」「ChatGPT」との違いは?
「機械学習」との違いは?
多くの企業が生成AIガイドラインを作成し始めている
生成AIを社内で利用する上で気を付けるべきことは?
データ入力に際して注意すべきこと
著作権・商標権・意匠権の侵害
パブリシティ権の侵害
個人情報や機密情報、他社から秘密保持義務を課されて開示された秘密情報を入力しない
生成物利用に際して気をつけるべきこと
回答の根拠や裏付けを行う
生成物に著作権が発生しない、商用利用ができない
対外的に利用する場合はその旨をわかるようにする
社内専用の生成AI!プライベートLLMとは?
プライベートLLMがなぜリスクを抑えることができるのか
企業でのLLM活用がどのように広がっていくか
文章作成のサポート・情報の検索やサマライズ
広告やデザイン制作におけるサポート
カスタマーサポートのオペレーションの効率化
個別化された顧客体験の提供
プライベートLLMを導入するには?
ステップ1:使用する目的と利用者について構想を練る
ステップ2:適切なプラットフォームを選定する
ステップ3:会話の流れと応答をデザインする
ステップ4:モデルの学習とカスタマイズを行う ステップ5:テストとフィードバックを繰り返して改良する
LLM(大規模言語モデル)とは?
LLMという言葉を初めて聞く方も多いのではないでしょうか。
LLM(Large Language Models)は日本語では大規模言語モデルと言われており、とても巨大なデータセットとAIのディープラーニング(深層学習)の技術を用いて構築された言語モデルです。
言語モデルは、文章・単語の出現確率を用いてモデル(お手本/型)化したもので、ChatGPTなどのようなテキスト生成AIのような文章作成などの自然言語処理(人間が使用する言語)で利用されています。つまり、大量のテキストデータを学習することで、人間の言語を理解し、人間が使うように自然かつ、流暢で論理的な言語生成を実現させるものなのです。
「生成AI」「ChatGPT」との違いは?
生成AIとは、テキスト、画像、動画、音声などを生成できるAIを総称している言葉で、AIによって情報や創造物を作成する技術のことを指しています。
LLMは自然言語処理に特化した言語モデルであるため、位置づけとしては、生成AIの一種となり、特に自然言語処理を担うモデルとなります。
そしてよくメディアで聞くようになったChatGPTは、その技術のことを指しているのではなく、OpenAI社という企業が開発したAIモデル、サービスのことであり、LLMの一つの事例と言えます。
テキスト生成AIとしては、代表的なものを上げると、OpenAI社のChatGPTやMicrosoft社のBing Chat(2023年12月1日にはMicrosoft Copilotがサービス開始)、Google社のBardがあります。それ以外にも日々新しいサービスが開発され、公開されています。
「機械学習」との違いは?
AI分野の機械学習とは、データセットを用いてコンピューターに学習させる技術のことを指しています。
一方で、LLMはテキストデータを用いて文の構造や文脈、単語を学習することで、文章を生成したり、チャットボットのように質問に回答したりできるAIモデルです。
つまり、AIを動かすために必要な工程として機械学習、そしてその中にディープラーニングがあり、AIのある種類として、生成AIがあり、その中の一つの種類としてLLMがあり、ChatGPTはLLMサービスの一種として位置づけをすることができます。
LLMに関係する言葉を図にまとめてみると、このような関係性となっています。
多くの企業が生成AIガイドラインを作成し始めている
2022年末にChatGPTが発表されて以降、世界中で注目を集め、業務効率化しながら、かつ安全に利用できるようにと、2023年春頃から多くの企業や組織で、生成AIのガイドラインが発表されています。
政府や自治体ではデジタル庁の総務省や文部科学省、東京都のデジタルサービス局を筆頭に、大学などの教育機関や企業でもガイドラインが作成され、それらはインターネット上で確認することができます。
一般社団法人日本ディープラーニング協会(JDLA)では生成AIの活用を考えている組織がスムーズに導入を行えるようにと『生成AIの利用ガイドライン』(https://www.jdla.org/document/)を策定しました。
こちらは様々な組織が導入できるよう、組織内のガイドラインとして最低限の守るべきことが書かれており、ひな形として利用することができます。
生成AIを社内で利用する上で気を付けるべきことは?
様々な組織から公開されているガイドラインでは、気を付けるべきこととして、「データ入力をする際」と「生成物を利用する際」の大きく2つについて言及されています。
データ入力に際して注意すべきこと
著作権・商標権・意匠権の侵害
第三者の保有している著作権、登録商標や意匠保護の観点から、意図して既存の著作物と同一もの、類似したものを生成しようとプロンプト(利用者が入力する質問や指示のこと)を入力することは著作権・商標権意匠権侵害になる可能性があるとしています。
パブリシティ権の侵害
生成AIを利用して生成された著名人の氏名や肖像について、商用利用する行為がパブリシティ権侵害に該当します。
個人情報や機密情報、他社から秘密保持義務を課されて開示された秘密情報を入力しない
ChatGPTにおいては個人情報を入力する際に当該個人情報により特定される本人の同意が必要となりますが、サービスによってはそれがクリアとなっている可能性もあります。
ただし、入力行為が個人情報保護法の規定に違反することになる可能性やセキュリティ対策においてはサービス提供者に依存してしまう点で、万が一の場合、情報漏洩となるリスクがあります。
生成物利用に際して気をつけるべきこと
回答の根拠や裏付けを行う
生成AIの自然な回答により、情報が正しく見えてしまいますが、偏った価値観、誤った情報、アンコンシャスバイアスが反映されてしまい、結果的に虚偽や既存の権利を侵害する内容になっている可能性があります。そのため、必ず根拠や裏付けを確認する必要があります。
生成物に著作権が発生しない、商用利用ができない
一般的に生成AIで作られたものには、原則著作権は発生しません。しかし、AIが著作物を学習しており、生成されたものがすでにある著作物と高い類似性を持つ場合は著作権侵害を疑われる可能性があります。
そしてChatGPTで生成されたものに関しては、利用において明確な制限がないため、この点は問題外になりますが、画像生成AIのMidjourneyでは無料会員では商用利用不可となっており、商用利用ができないケースもあります。
利用する生成AIサービスの規約を確認したうえで利用するようにしましょう。
対外的に利用する場合はその旨をわかるようにする
東京都デジタルサービス局が定めている『文章生成AI利活用ガイドラインVer1.2』(https://www.digitalservice.metro.tokyo.lg.jp/documents/d/digitalservice/ai_guideline/)では、
「内容を確認した後、翻訳文や要約文等、文章生成AIの回答を対外的にそのまま使用する場合は、「文章生成AI により作成」と記載することで、生成された文章がAIによるものか人間によるものかを読み手に伝えることが できます。」としています。
社内専用の生成AI!プライベートLLMとは?
前章では、サービスとして公開されている生成AIをいかに使うかということを見てきましたが、個人情報を多く取り扱う金融機関や、独自性のある技術などを多く持つ企業にとって、ガイドラインが定められていたとしても、生成AIサービスを使うことに関しては大きなリスクを伴います。
様々なリスクを回避しながらも、記録用やアイデアのたたき台、社内情報を探すための検索ツール、社内専用のチャットボットなど生成AIの利便性を活用することで、社内業務の効率化につなげたいと考えている企業は多いのではないでしょうか?
それを可能にするのが、プライベートLLM、またはプライベートAIとも呼ばれています。
昨年2023年12月にはカナダのトロントに本社を置く、Private AI Inc.社の製品を神奈川県に本社を置く株式会社マクニカが販売代理店契約を締結したことを発表し、今年2024年1月には、株式会社野村総合研究所とNRIデジタル株式会社がプライベートLLMのソリューションを2024年春以降に提供を開始するというニュースが話題に上りました。
プライベートLLMがなぜリスクを抑えることができるのか
プライベートLLMは基盤モデルが公開されているLLMを利用して、プライベートLLMを利用する企業のデータを利用して、利用目的と業務に合わせてカスタマイズすることができます。
これはプライベートクラウドサービス上、そして企業内で自社運用する情報システム上で動作させることで、機密情報を安全に扱うことを可能にしています。
企業でのLLM活用がどのように広がっていくか
LLMにより、AIの活用領域は格段に広がりを見せました。なぜならこれまでのAIの機械学習モデルは特定のタスクの効率化や自動化を行うものだったからです。
一方で、LLMは自然言語処理を可能にしているため、企業の問い合わせ窓口で設置されるようになったチャットボットのように、個別化された顧客体験の提供やこれまで自動化が難しかった、クリエイティブ領域における作業の効率化を行うことができるようになることが期待されています。
文章作成のサポート・情報の検索やサマライズ
蓄積されたデータの中から、ユーザーにとって必要な情報のみを取り出し、まとめることが得意なLLMが最も力を発揮できる使い方の一つとして挙げられます。
これを利用することで、過去の議事録やメールなどのバラバラに存在している膨大な量のデータの中から取り出したい内容だけをまとめることが出来るため、短時間で網羅的に情報をまとめインプットすることができ、業務効率化につながります。
また、文章作成の際の構成のたたき台を作成したり、メールへどのように返信すればよいか迷った際には下書きを作成することもできます。
広告やデザイン制作におけるサポート
つい最近では画像、動画、ナレーション、音楽、モデルすべてを生成AIで作成した広告が採用されSNSを中心に大きな話題となりました。
この事例からわかるように、すべてを生成AIでするだけではなく、ナレーションの文章案をLLMが作成して、画像生成AIがイメージを作成するなどのサポートとして使われることで、クリエイティブ作成の作業効率を格段にアップできるようになっていくでしょう。
カスタマーサポートのオペレーションの効率化
これには大きくわけて2つの可能性があります。
一つには現在も多くのサービスで実装されているように、カスタマーサポートセンターでAIに聞くことができるチャットボットとしての顧客体験の提供です。コールセンターを設置している企業も多いですが、24時間対応できる環境や人員を用意するのが難しい場合や、サポートの質や知識量が属人的になってしまったり、問い合わせを受けて、マニュアル通りに顧客にベストな回答をするためには、社内の情報と照合させる必要があったりなどのデメリットを抱えています。
LLMが活用されているチャットボットを設置することで、24時間対応を可能にするだけでなく、問い合わせ内容の分析と定型的な問い合わせに対しての効率化を実現することが出来るようになります
その結果、企業としては人件費を削減でき、顧客側も待ち時間が長くなることが多いコールセンターを利用せずとも、自ら問題解決を行うことが出来るようになるだけでなく、利用回数が増えていくことでより柔軟に顧客のニーズを満たすことが出来るようになり、顧客満足にもつながります。
個別化された顧客体験の提供
個人で旅行に出かける際には事前にブログやSNSを利用して情報収集を行うことが多いでしょう。それも楽しみの一つではありますが、プランを自分で考えたり、調べたり、まとめるのが億劫だと考える人もいるでしょう。その場合は、情報がその土地の情報が蓄積されたLLMを利用することで、その人の趣向にあったパーソナライズ化された旅を提供することが出来るかもしれません。
その結果、旅行会社やディベロッパーなど街づくりに関わる企業は旅行におけるニーズを把握することができ、顧客は個別化された情報を得ることが出来るようになるでしょう。
プライベートLLMを導入するには?
様々なLLMの活用方法があることが分かりました。今後はますます様々な業種や業界での導入が増えていくことが予想されますが、実際にプライベートLLMを導入するにはどのような方法があるのでしょうか。
プライベートLLMを導入するには、プライベートクラウドを利用するか、社内のオンプレミス環境で導入することで利用できます。作り方には5つの工程があります。
ステップ1:使用する目的と利用者について構想を練る
構築を始める前になぜプライベートLLMを導入するのかという目的と、利用者が誰なのかを明確にします。
LLMが行う具体的なタスクややり取り、顧客サービスなのか社内情報検索なのかという目的を特定し、ニーズを理解することが必要です。
ステップ2:適切なプラットフォームを選定する
LLMの作成と展開をサポートするプラットフォ―ムを選定します。その際、以下のことを考慮すると良いでしょう。
・セキュリティ対策がしっかりとできるか
・既存システムとの統合がうまくできそうか
・ユーザーフレンドリーなインターフェイスか
・拡張性やカスタマイズができるか
ステップ3:会話の流れと応答をデザインする
企業のブランドのイメージにあったトーンで明確な会話フローを作成したのち、ユーザーからの問い合わせとそれに対応する回答の包括的なリストを作成します。
その際、ブランドの価値とサービスを反映しているか、ユーザーに適切かつ、そのユーザーに合った内容になっているか、自然でわかりやすく魅力的なダイアローグになっているかの確認を行います。
ステップ4:モデルの学習とカスタマイズを行う
開発する目的に沿った関連のデータセットを活用して定義した使用方法に従って機械学習を行います。その際、企業のブランドに合わせた言葉遣いになっているか、文脈に対応した応答になっているかを調整します。この作業を行うことで、正確な情報を提供できるだけでなく、利用者の安心感や共感、顧客が使用する場合は満足感を醸成することにつながります。
ステップ5:テストとフィードバックを繰り返して改良する
プライベートLLMの使用をローンチする前に徹底的なテストを行います。多様なユーザーからフィードバックをもらうことで改善点を洗い出し、それに基づいて必要な調整を行い、パフォーマンスに問題がなければ、プラットフォーム全体にプライベートLLMを展開します。
まとめ
いかがでしたでしょうか。最近話題になっているプライベートLLMとはどのようなものか、そしてその作り方や有用性についてお分かりいただけたと思います。
harBest(ハーベスト)では、業務効率化や自動化、DX推進の必要性を感じていてもなかなか踏み出せない、AI開発に不安を持つお客様に寄り添い、その一歩を踏み出すための課題設定からAI実装まで包括的なサポートをしております。
そしてAI開発において重要な教師データの作成には、弊社の多数のクラウドワーカーによる高品質なデータ作成とWEBでの発注による、スピーディーかつコストパフォーマンスの高いデータセットの準備が可能です。 AI開発につきまして下記よりお気軽にお問い合わせください。