RAGという技術の登場により、社内情報を対象とした上で、生成AIにアウトプットさせることが実現しようとしている。この技術は、確実に次世代のサービスを塗り替えるものだと個人的には確信している。
しかし視点を変えてみれば、これはある意味、クラウド型のアプリケーション、いわゆるSaaSからオンプレ型への回帰を意味することと思う。特に筆者はB2B寄りのキャリアであるため、 このエントリでもそちらの話を中心にする。
B2B SaaS と RAG
B2B SaaSはその性質上、扱う情報の機密性が非常に高い。筆者の前職である名刺管理SaaSにおいても、高いセキュリティレベルが求められた。そのためにセキュリティ関連の認証制度などを取得し、その安全性を喧伝しているわけだ。特にエンタープライズ企業のセキュリティシートの分量には非常に驚くであろう。
そこでRAGはどうであろうとを考えてみる。
この記事を読んでいる時点で言わずもがなだが、ChatGPTに聞いたところ、RAG(Retrieval-Augmented Generation)は、生成AIの一種で、事前に蓄えられた外部データを活用して、より正確でコンテキストに基づいた回答を生成する技術である。
引用: https://aws.amazon.com/jp/what-is/retrieval-augmented-generation/
RAGを始めるためには、まずデータが必要で、それはストレージサービスだったり、既存のチャットツールやメモサービスなど、多種多様な場所からデータをEmbeddingさせる必要がある。つまり元のデータソースから情報を抜き出さねばならないのである。
これは旧来のB2B SaaSの取り扱うセキュリティレベルの比ではない。まず取り扱う必要のある量、そしてその中身の質、いずれをとっても、絶対に流出してはいけないレベルの情報がゴロゴロとひしめいている。
あえて強い言葉で言えば、RAGを導入したい場合、ベンダーに命綱を握られてしまうことになる。
あらたなセルフホスト型という選択肢
これは大きな問題だ。では自社構築するのか?実はもう一つのオプションがありうる。 それは、オンプレ型といっても、まったく旧来の個社ごとにシステムを開発する受託開発のようなスタイルともやや異なる。
あくまでもインフラ環境のみを自社内に構築し、いわゆるUIなどの皮をSaaSで提供するというモデルだ。データの送受信は基本は自社内に完結できる。 受託開発 = オンプレという(誤?)認識もあるゆえ、個人的にはセルフホスト型という言葉が気に入っている。記事のタイトルはやや煽り気味だったことをここで謝りつつ、ここからはセルフホスト型と表記させていただく。
つまり、開発体制や契約形態のベースはSaaS的でありながらも、あくまでもユーザ企業は、オプションとしてセルフホスト型を選べるような形式である。
これは感覚的ではあるがRAGに限らず、海外の各種SaaSを眺めていると、オンプレ型として提供することが増えているように感じる。セルフホスト型は何も新しいものではない。最も印象深いのはGitLabであろうか。ソースコードというソフトウェア企業にとっては最もセキュアかつ重要な資産をSaaS(Web)上に配置せずに自社のなかで持ちたいというのは想像に容易くない。
日本にを目を向ければ、Backlogなどもエンタープライズ向けにオンプレミス型のサービスが提供されていることは有名だろう。基本はSaaSではあるが、選択肢としてあるという状況だ。
さて、生成AIの文脈で言えば、Cohereなどはまさにその代表である。Command-R+などのモデルを提供しつつ、エンタープライズ向けAIプラットフォームとして名打つ企業だが、当然のようにデプロイ方法にも、Private Deployment というセルフホスト型を提供している。
https://cohere.com/deployment-options
生成AIの文脈で最先端をいく企業の一つであるが、いわゆるOpenAIやAnthropicなどと比べると、彼らは明確にエンタープライズ企業に対してのプラットフォームである強く謳っているように思える。
> Enterprise-grade AI deployment on any cloud or on-premises.
当然ながら、あくまでのデプロイ形態のみに限った話ではないが、この自社内のデータを活用する文脈におけるセキュリティの重要度はエンタープライズ企業において、さらに顕著になると思われる。RAGという強烈のメリットを享受しながらエンタープライズセキュリティレベルを担保するための選択肢としての完全なるSaaSから脱却が必要になる。
最後に
さて、最後にはなるが、日本では基幹システムにおいては、未だにSIer文化も強いことから、完全にセルフホスト型が勝ち抜いていけるかを読めていないところではある。ただSaaS界隈にいるものとしては、だからこそセキュリティが守られないという可能性もあるわけで、そこをSaaSエンジニアの各位は腕の見せ所だろう。
SaaS企業はオンプレをしない、SIerはSaaS(クラウド)を利用しないという構造ではないため、単純な二項対立にはならないが、国内のRAGという巨大な市場のうねりを、SaaS事業者が制すのか、はたまたSIerが制すのか、それとも何かしら融合が起きるのか。大変見ものである。