LangCloudテクノロジーズ

LangCloudテクノロジーズ合同会社

テックブログ

創業時に考えたこと

2024-11-12

写真：ケンブリッジの街の西側を南北に流れるケム川の風景（2024年5月に撮影）
　　
はじめに
　LangCloudテクノロジーズ・代表の小林です。会社設立後はじめてのテックブログをお届けします。今回は初回ということもあり、会社として取り組む技術開発の方向性に加えて、会社創業までの経緯、創業時に考えたことなどをご紹介いたします。
　
　
パソコンで動作するオープンソースLLM出現の衝撃
　みなさんもご存じの通り、2022年11月30日にOpenAIがChatGPTを発表し、今月で2年が経とうとしています。私自身、生成AIの発展は薄々気が付いていましたが、ChatGPTレベルのAIの出現はまさしく「寝耳に水」の出来事でした。多くの方が同じような状況だったのではないでしょうか。　
　
　ChatGPTの熱狂が世界中に広がる中、私もじっとしていられず、発表から数か月後には部屋の隅でほこりをかぶっていた型落ちGPUを搭載したゲーミングPC（GTX 1050 Tiを搭載したASUSノートPC）を取り出し、巷に出回り始めたオープンソースの大規模言語モデル（LLM）をいくつか動かし始めていました。非力なGPUもあって、モデルのレスポンスはとても遅くはあったのですが、パソコンで継続事前学習やファインチューニングなどにもチャレンジしながら、これは大変なことになったと大きな衝撃を受けました。特にマルチモーダルの視覚系言語モデルであるLLaVAがパソコンの中で動いた時はかなり驚いたものです。　
　
　このような中、自分自身のライフステージの変化も重なり、数か月後の2023年11月に脱サラし、2024年1月22日、かねてから夢であった会社設立に至ります。この起業においては、ChatGPTの出現もさることながら、タケノコのように出現しはじめた優れたオープンソースLLMの存在が強く私の背中を押したことは間違いありません。以下では、そのあたりの話を含め、会社の創業時に考えたことを掘り下げてみたいと思います。　
　
　
人とAIがコラボレーションする新しい仕事の形を求めて
　振り返ってみると、昨年までの10年余り、私は黎明期のデータサイエンティストとして、製造・金融を中心に数多くの企業の方々と共に最先端のデータサイエンス・AIを用いた新たなデータ活用を探ってきました。私は案件成功の打率は高い方ではありましたが、うまくいく案件もあれば、条件が整わずうまくいかないケースも当然ありました。最近はノーコード・ローコードのデータ分析ツールも出回り始め、AIの民主化が大きく進んだ状況にありますが、たとえツールが使いやすくなったとしても、データ分析やAI構築では、様々な条件が適切に整わないと中々ゴールにたどり着けません。例えば、ドメイン知識がないために解き方を具体化できない、そもそも解けない問題を解こうとしている、必要とされるデータが不足しているなど、さまざまな問題が立ちはだかります。　
　
　そのような問題に対処するため、長年、データサイエンティストやデータアナリストの育成が叫ばれ、私自身も数多くのデータ分析の実務家の育成をご支援してきました。この10年間の世の中のDX推進の状況を振り返ってみると、確かにノーコード・ローコードツールは現場の助けになりはじめてはいますが、本質的には、現場においてデータ分析の実務家が必要とされる状況は大きくは変わっておらず、問題を適切に解きほぐし、現場で正しい指示ができる「人」は昔も今も変わらず重宝されています。
　
　このような問題意識の中、ChatGPTの登場は私にはとてつもなく大きなゲームチェンジャーとして映りました。ことばのコミュニケーションスキルを持つAIが、専門家あるいは仕事仲間として、人とコラボレーションしながら働く新しい形の「働く場」。それはデータ分析だけにとどまらずあらゆる職場・現場が対象であり、これまでの業務や労働の概念を変える可能性があると気が付きました。もちろん人間の専門家の育成も必要ではありますが、同時に、優れたAIを創り上げて現場に投入し、人とAIがコラボレーションしながら業務を行い、問題解決をする未来に思いをはせました。　
　
　つい数年前まではサイエンスフィクションのように思われたことが、ChatGPTに代表される生成AI技術の進化により、実現の可能性が大きく拓かれつつあります。働き手不足がかつてないスピードで進む日本の労働現場を少しでも助けたいという思いとともに、人とAIの仕事のコラボレーションの形を追及し創造していきたいと決意したことが起業の大きなきっかけであり、モチベーションとなりました。
　　
　
オープンソース、エッジ、マルチモーダル、エージェント
　現在、様々な生成AIサービスが提供され始めています。OpenAIのChatGPTをはじめ、マイクロソフトが展開するCopilotの各サービス、AWSのAmazon Bedrock、Google GeminiなどのクラウドAPIサービスもあれば、オープンソースの大規模言語モデル開発・提供を進めるMetaなど、ビッグテックによる生成AIビジネスはまさに群雄割拠の状況です。HuggigFaceには数えきれない数のオープンソースのモデルがアップロードされ続けています。日本を見れば、IT各社によるLLM開発競争が繰り広げられ、その多くが商用利用可能なオープンソースとして市場に提供されています。さらに直近での生成AI業界の動向を見ると、これまでの対話型AIから、AIエージェントと呼ばれる自律型AIに主戦場が移り始めている状況も見えてきています。
　
　このような状況の中、弊社の取り組む技術開発の方向性は「オープンソース」、「エッジ」、「マルチモーダル」、「エージェント」の４つのキーワードにまとめられます。
　

「エッジ」は「ローカル」とほぼ同義で、ローカルLLMに代表されるパソコンやオンプレミスサーバで動作するエッジAIを指しますが、エッジAIを含む様々なコンポーネントが稼働するシステム全体のアーキテクチャは、プライベートクラウドで構成されるローカルネットワークが目指すものです。
「マルチモーダル」にこだわる理由は、仕事の現場に代表されるリアルな世界（実世界）では、単なるコトバによるやり取りだけでなく、視覚、聴覚、触覚など、IoTあるいはロボットをインタフェースとしたデータを扱う必要があるからです。
いま流行りの「エージェント」はビッグテックを始め、大手IT企業がこぞってサービス化を進めていますが、弊社は少し先を見据えて、実世界でのエージェントにフォーカスしていきます。複数のエッジAIやクラウドAIがネットワークの中で相互に通信しあい仕事を進めるネットワーク型のマルチエージェントはすでに古い概念ですが、そういったものの現実解を探し当てたいと考えています。
おそらくこの中で本質的に重要なキーワードは「オープンソース」であると考えます。世界中の数多くの優秀なAI開発者がコミュニティを形成し、日夜、オープンソースの優れたソフトウェアを開発し、互いに交換し合い、切磋琢磨しています。Metaが唱えるAIの普及におけるオープンソース戦略がどの程度他ビッグテックのクローズド戦略に対して重要かといったような議論はありますが、弊社としては、世界に大きく拓かれた活発なAIのオープンソースコミュニティと共に歩み、まずは技術的に遅れずに日々キャッチアップし続けていくことが大事なことだと考えます。さらにいえば、社会貢献の観点から、オープンソースを活用した低価格で高品質なAIソリューションを日本の多くの中小企業へ提供し、DX推進の力にしていただくことがとても重要であると考えています。
　
　以上で初回のテックブログを終わりたいと思います。ここまで読んで下さり、ありがとうございました。
　
※ 創業時に考えたもう一つのテーマ「社会・環境の未来リスク予測」と、このところ重要性を増してきているAI安全性については、今後タイミングを見てブログの中で取り上げていけたらと思います。