LangCloudテクノロジーズ合同会社
テックブログ
創業時に考えたこと
2024-11-12
写真:ケンブリッジの街の西側を南北に流れるケム川の風景(2024年5月に撮影)
はじめに
LangCloudテクノロジーズ・代表の小林です。会社設立後はじめてのテックブログをお届けします。今回は初回ということもあり、会社として取り組む技術開発の方向性に加えて、会社創業までの経緯、創業時に考えたことなどをご紹介いたします。
パソコンで動作するオープンソースLLM出現の衝撃
みなさんもご存じの通り、2022年11月30日にOpenAIがChatGPTを発表し、今月で2年が経とうとしています。私自身、生成AIの発展は薄々気が付いていましたが、ChatGPTレベルのAIの出現はまさしく「寝耳に水」の出来事でした。多くの方が同じような状況だったのではないでしょうか。
ChatGPTの熱狂が世界中に広がる中、私もじっとしていられず、発表から数か月後には部屋の隅でほこりをかぶっていた型落ちGPUを搭載したゲーミングPC(GTX 1050 Tiを搭載したASUSノートPC)を取り出し、巷に出回り始めたオープンソースの大規模言語モデル(LLM)をいくつか動かし始めていました。非力なGPUもあって、モデルのレスポンスはとても遅くはあったのですが、パソコンで継続事前学習やファインチューニングなどにもチャレンジしながら、これは大変なことになったと大きな衝撃を受けました。特にマルチモーダルの視覚系言語モデルであるLLaVAがパソコンの中で動いた時はかなり驚いたものです。
このような中、自分自身のライフステージの変化も重なり、数か月後の2023年11月に脱サラし、2024年1月22日、かねてから夢であった会社設立に至ります。この起業においては、ChatGPTの出現もさることながら、タケノコのように出現しはじめた優れたオープンソースLLMの存在が強く私の背中を押したことは間違いありません。以下では、そのあたりの話を含め、会社の創業時に考えたことを掘り下げてみたいと思います。
人とAIがコラボレーションする新しい仕事の形を求めて
振り返ってみると、昨年までの10年余り、私は黎明期のデータサイエンティストとして、製造・金融を中心に数多くの企業の方々と共に最先端のデータサイエンス・AIを用いた新たなデータ活用を探ってきました。私は案件成功の打率は高い方ではありましたが、うまくいく案件もあれば、条件が整わずうまくいかないケースも当然ありました。最近はノーコード・ローコードのデータ分析ツールも出回り始め、AIの民主化が大きく進んだ状況にありますが、たとえツールが使いやすくなったとしても、データ分析やAI構築では、様々な条件が適切に整わないと中々ゴールにたどり着けません。例えば、ドメイン知識がないために解き方を具体化できない、そもそも解けない問題を解こうとしている、必要とされるデータが不足しているなど、さまざまな問題が立ちはだかります。
そのような問題に対処するため、長年、データサイエンティストやデータアナリストの育成が叫ばれ、私自身も数多くのデータ分析の実務家の育成をご支援してきました。この10年間の世の中のDX推進の状況を振り返ってみると、確かにノーコード・ローコードツールは現場の助けになりはじめてはいますが、本質的には、現場においてデータ分析の実務家が必要とされる状況は大きくは変わっておらず、問題を適切に解きほぐし、現場で正しい指示ができる「人」は昔も今も変わらず重宝されています。
このような問題意識の中、ChatGPTの登場は私にはとてつもなく大きなゲームチェンジャーとして映りました。ことばのコミュニケーションスキルを持つAIが、専門家あるいは仕事仲間として、人とコラボレーションしながら働く新しい形の「働く場」。それはデータ分析だけにとどまらずあらゆる職場・現場が対象であり、これまでの業務や労働の概念を変える可能性があると気が付きました。もちろん人間の専門家の育成も必要ではありますが、同時に、優れたAIを創り上げて現場に投入し、人とAIがコラボレーションしながら業務を行い、問題解決をする未来に思いをはせました。
つい数年前まではサイエンスフィクションのように思われたことが、ChatGPTに代表される生成AI技術の進化により、実現の可能性が大きく拓かれつつあります。働き手不足がかつてないスピードで進む日本の労働現場を少しでも助けたいという思いとともに、人とAIの仕事のコラボレーションの形を追及し創造していきたいと決意したことが起業の大きなきっかけであり、モチベーションとなりました。
オープンソース、エッジ、マルチモーダル、エージェント
現在、様々な生成AIサービスが提供され始めています。OpenAIのChatGPTをはじめ、マイクロソフトが展開するCopilotの各サービス、AWSのAmazon Bedrock、Google GeminiなどのクラウドAPIサービスもあれば、オープンソースの大規模言語モデル開発・提供を進めるMetaなど、ビッグテックによる生成AIビジネスはまさに群雄割拠の状況です。HuggigFaceには数えきれない数のオープンソースのモデルがアップロードされ続けています。日本を見れば、IT各社によるLLM開発競争が繰り広げられ、その多くが商用利用可能なオープンソースとして市場に提供されています。さらに直近での生成AI業界の動向を見ると、これまでの対話型AIから、AIエージェントと呼ばれる自律型AIに主戦場が移り始めている状況も見えてきています。
このような状況の中、弊社の取り組む技術開発の方向性は「オープンソース」、「エッジ」、「マルチモーダル」、「エージェント」の4つのキーワードにまとめられます。