OpenAIが「ChatGPT」を公開したのは2022年11月のこと。そこから瞬く間に“生成AI”の技術進化は進み、多くのビジネスパーソンにとっては必要不可欠のものとなった。とりわけ2024年はChatGPT o1 Proモードが登場するなど、性能も格段に向上。ますます生成AIが手放せないものになった、という人も多いのではないだろうか。
そんな生成AIの進化を有識者たちは、どう捉えているのだろうか。2024年12月20日に「2024生成AI革命期を振り返る忘年会」と題したイベントが開催された。同イベントで、LINEヤフー 上級執行役員 生成AI統括本部長の宮澤 弦氏、Sakana AI リサーチサイエンティスト 秋葉拓哉氏が登壇した「生成AIの2024振り返りと今後の展望」のセッション内容をまとめた。モデレーターはLayerX 代表取締役CTO 松本勇気氏が務めた。
LINEヤフーとSakana AIが振り返る、生成AI活用における「2024年」
松本:今日はお二人からいろんな話をお聞きできればと思っています。まずは2024年の振り返りをしていきたいのですが、宮澤さんにとって2024年はどんな1年でしたか?
宮澤:生成AIの活用・導入に取り組んだ1年だったな、と思います。LINEヤフーは2023年6月に生成AI社内推進組織「生成AI活用推進室」(現:生成AI統括本部)を立ち上げ、個人向けサービスを中心に、生成AIの活用・導入に取り組んできています。
私たちが提供しているサービスは、“昔のインターネットサービス”だと思っているので、時代の流れに付いていけなくなったら終わると思っていて。生成AI時代に向けた検索体験やチャット体験を作らないと使われなくなってしまうという危機感から、いち早く生成AIの活用・導入に取り組んでいて、2024年12月時点で32件のサービス、社内活用に生成AIを取り入れています。
それだけでなく、LINEヤフーで働くメンバーの日常業務にも生成AIをどんどん活用しています。カスタマーサポートのメール対応や問い合わせフォームの自動応答などは、過去のやり取り全部学習した生成AIが対応していて。生成AIを活用した業務効率化ツールにより、年間70〜80万時間の削減を目指しています。
今後は生成AIの活用範囲をさらに広げていくとともに、今まで人力で対応してくださっていた方々には創造性の高い仕事に取り組んでいってもらえたらと思っています。
松本:ありがとうございます。秋葉さんは“研究者”でもあるので、宮澤さんとは違った視点で話が聞けるのではないかと思っています。秋葉さんにとってはどんな1年でしたか?
秋葉:とにかく、いろんなことをやった1年だったなという感じです(笑)。Sakana AIは2023年7月に設立したばかりで、まだ1年弱しか経っていません。自分は最初のフルタイム従業員として12月に入社したのですが、当時は本当に何もない状態で。まずは研究開発するためにGPUを確保せねばならず、いろんなベンダーさんに話をしに行きました。
また、採用のためにリファラルしたり、ジョブディスクリプションを書いたり、同時並行でチームづくりをするなど、会社のために何でもしていましたね。
事業内容に関しても、プレスリリースでは「自然にインスパイアされたインテリジェンスに基づく新しい形の基盤モデルの創造」と言っていたのですが、具体的な方向性は明確に定まっていなくて。最初の頃はディスカッションしながら、事業の方向性を定めていく、ということをやっていました。2024年の上半期で組織の人数も10人以上になり、そこから経済産業省/NEDOによる生成AI開発支援プロジェクト「GENIAC」に採択され、研究開発を進めていました。いろんな変化があり、一気に数年分の経験をした1年だったなと思います。
松本:せっかくの機会なので、ぜひ秋葉さんにお聞きしたいなと思って。Sakana AIは基盤モデルの開発を最優先に研究開発を進めているんですか?
秋葉:基盤モデルを開発する優先度はそこまで高くなくて。どちらかと言えば、私たちが開発したいものは“技術”なんですよね。この技術というのは、基盤モデルを開発するための技術です。1つの基盤モデルを開発するコストってすごく高いんですよ。
そうした中、ここ数年で基盤モデルの開発に投資したコストに見合うだけの価値が得られなくなっている。基盤モデルを開発した瞬間から、価値が減衰してしまっているんです。他社からも良い基盤モデルがリリースされるので、半年も経たないうちに開発した価値がほとんどゼロになってしまっています。そのため、基盤モデルを開発することにコストをかけるのは良くない方針だなと思っていて。Sakana AIも基盤モデルを開発することはありますが、それはあくまでも技術のデモンストレーション。本質は技術の開発であり、その技術を蓄えていくことによって、会社の価値を上げていきたいと思っています。
Chatbot Arenaがサチる、人間では評価できないほどに生成AIが進化
松本:ここから、生成AIの技術進化をテーマに話をしていきます。2024年は凄まじいスピードで生成AIが進化を遂げていった1年だったと思います。自分にとって一番衝撃だったのは、ChatGPT o1 Pro Modeが出たことです。最近はChatGPT o1 Pro Modeをとにかく仕事で使いまくっていて。例えば経営課題を投げかけてみると、自分の頭の中にはなかった視点での回答がひたすら出てくるので、経営の壁打ちのようなことをやっています。
2024年もいろんな技術進化やリリースがありましたが、その中でお二人が「これ面白かったな」と思うものを、あえて一つ挙げるとしたら何でしょうか?
秋葉:質問の回答になっているかわかりませんが、個人的に「面白いな」と思った現象がChatbot Arena(チャットボット・アリーナ)がサチった(限界に達した)ことです。
簡単に説明すると、Chatbot ArenaはLLMのベンチマークプラットフォーム。ランダムに選択された2つのモデルに対してプロンプトを入力し、どのLLMが回答しているか明かされない状態で、どちらが優れているかを選択する。それでランキングをつけるというものです。
2023〜2024年頭にかけては、Chatbot ArenaがLLMのベンチマークプラットフォームとして最も信頼の置けるものと言われていたんです。それ以外のものはハックされている、と。そのChatbot Arenaで勝ち続けているGPT-4はすごい、という感じだったんです。
ただ、今はもうChatbot Arenaは全然面白くなくて。その理由はサチってしまったからです。ちょっとしたプロンプトであれば優劣がつけられないぐらい、どちらも同じような回答をするようになった。「こんなに変わるのか」と思うくらいに生成AIの技術進化が進んだなと思います。「OpenAI o1」は特定の分野においては、もう人間を超えちゃってるじゃないですか。人間が評価できないとなってきたときに、今後の進化が難しくなってきているなと感じるのが、個人的には面白いトレンドだと思っています。
松本:人間の限界はそろそろ超えてきていて。GPT-4oのモデルのアウトプットですら、もう違いが分からなくなってきてるんですよね。計測できるベンチマークを持てなくなってきた。今後の進化の余地は、どのような軸で見ていくべきですか?
秋葉:月並みな回答になってしまうんですけど、やっぱりリーズニング(論理的な思考、推論)能力ですね。数学オリンピックの問題を解く、プログラミングコンテストの問題を解くというような短いコンテキストの推論はすぐにサチると思っています。
個人的に興味があるのは、もっと長いコンテキストでの難しい推論です。人間って仕事をしてるときに、ものすごく長いコンテキストを踏まえながら仕事をするじゃないですか。
現時点では生成AIに長いコンテキストを踏まえた推論ができないからこそ、人間の仕事を置き換えられないと言われていると思っていて。そういった推論能力が上がってくると、できることが増えると思いますし、エージェンティックなフレームワークでも長い行動をしても破綻しないようになってくると、できることの幅が広がってくると思います。
LLMの学習のために対価を払う、新たなビジネスモデルが誕生!?
松本:宮澤さんは、いかがですか?
宮澤:少し違う視点でいくと、もちろん機能の進化もすごいのですが、それと同じくらい価格の下落がすごいと思っていて。それこそ、GPT-3.5からGPT-4o miniでは価格が1,800分の1くらいになっているわけです。それなのに性能がすごく上がっている。
これまで世の中に出てきた工業製品で、性能がすごく上がっているのに価格がすごく下がっているものってなかったんじゃないかと思います。異常とも思えるほどのスピードで競争が激しくなっていますし、GPUのパワーも加速度的に良くなっている。インターネットサービスを開発する側からすると、非常に嬉しい状況になっていますね。
もう1つが、先ほど秋葉さんがサチったと言っていましたが、各社がすでに地球上にあるデジタルデータはすべて学習しました、と言っているわけです。最近は雲の動きや潮の流れなど、常にデータとしてあり続けるものを取り込む方向に行っているんです。
そうした中、アメリカでは掲示板型ソーシャルニュースサイト「Reddit(レディット)」が営業利益を上げていて。それはなぜかと言うと、OpenAIやGoogleなどが「Reddit上にあるデータをLLMで学習させてほしい」と言って、学習のための対価を払っているからです。
これはもう新たなビジネスモデルのひとつですよね。LLMに学習させてあげる代わりに対価をいただく。きっと日本の学習コンテンツも不足している、あるいはもっと欲しいというのが今の状態だと思います。そこに対して「お金払ってくれたら学習データを提供します」というのは、テキストだけではなく画像や動画などの領域でもあると思います。
2025年は「AIエージェント」の年、大事なのはエラーとどう向き合うか
松本:ありがとうございます。あっという間にお時間が来てしまったので、最後に2025年の展望と言いますか、「来年はこういうことをやっていきたい」というものがあれば、ぜひお伺いしたいです。
宮澤:孫さんが言っているように、2025年は「AIエージェント元年」になると思っています。そこに対して、LINEヤフーもいろんな取り組みをする1年になるでしょう。
LINEヤフーの使命は、多くの人に対して圧倒的に使いやすいものを、圧倒的に安く提供することです。PayPayなどもそうですが、その思いでサービスを提供し続けてきました。ですから、「圧倒的に安く、圧倒的に使いやすい」を軸としながらAIエージェントを提供し、ユーザーが自然とAIエージェントを使っているような世界を目指したいなと思っています。
きっとほとんどのユーザーは「AIを使いたい」と思っていないと思うんです。だからこそ、AIであることを意識させずに、いかにAIを届けてあげられるか。LINEヤフーのような生活インフラのようなサービスを提供している会社には、その考えが必要だと思っています。その考えをもとに、2025年はAIエージェントに注力していきたいです。
松本:AIエージェントは、人によっていろんな定義があるなと思っています。LINEヤフーの中では、AIエージェントはどのような定義になっているんですか?
宮澤:まだ社内でも明確なコンセンサスが取れているわけではありません。ただ、分かりやすく説明するならば、これまで人間が手動でやらなければ最後のプロセスまで進まなかったものをAIが代わりにやってくれるものだと思います。
例えば、レストランを「今日の20時から4名で予約する」という場合、今までは人間が電話をかけなければいけなかったのですが、その電話のプロセスをAIがやってくれる。ここは「予約のエージェント」と定義していくようなかたちで、このようなエージェント機能をいろんなサービスに取り入れていけたらいいな、と思っています。
松本:AIエージェントを2年ほど前から追いかけていた中で難しいなと思うのは、ゴールにたどり着いたときに、それが正しいゴールなのかわからないという問題があって。例えば、お店の電話予約に関しても、店名が同じだけの別のエリアのお店に電話してしまうこともあるわけです。LINEヤフーはAIエージェントを組み込む過程で、どのようにそういった問題に向き合っていかれるんですか?
宮澤:きっとAIエージェントもミスをすると思うんです。やっぱり、いきなり100%の正答率を求めるのは無理がある。ミスをする前提のもとで組み込んでいき、活用していく中で少しずつ正答率を上げていく。それをひたすら繰り返していくのが大事です。そういう意味では、ミスが許される領域から試していくことになるのかなと思いますね。
松本:秋葉さんは、いかがですか?
秋葉:やっぱり自分もAIエージェントが話の中核に来ると思っています。今の宮澤さんの話は僕もすごい興味があり、やっぱりミスをするんですよね。ただ、チャットにおけるミスと、エージェントにおけるミスではその影響度合いが大きく違います。
そこがひとつ大きな課題になるのかなと思っています。そうした中で個人的には、今のトレンドであるリーズニング能力とAIエージェントは密接に関係したテーマだと思っています。
AIエージェントが難しい理由はたくさんありますが、その理由のひとつにエラーが積み重なっていく構造があります。なにかひとつのエラーが起きたら、それをきっかけにエラーがどんどん積み重なっていってしまう。AIエージェントの方が根本的にエラーが起こりやすい構造になっていているので、1回1回のエラー確率を下げていかないと、AIエージェントは実用化していかないなと思います。それを踏まえると、難しい問題も余裕で解けるぐらいにリーズニング能力が上がっていくと、AIエージェントの未来が開けていく。この2つの進化が2025年に起こると、すごく面白くなるんじゃないかなと思っています。
松本:お二人の話を聞いていて、「2025年はAIエージェントの年」と言われている中で大事なのはエラーとの向き合い方な気がしますね。間違ってもいい体験づくり、間違っても復旧するための仕組みづくりが必要になりそうですね。
宮澤:本当にそう思います。世の中には「ごめんなさい」で許されることと許されないことってあるじゃないすか。LINEヤフーでは「ごめんなさいで許されないことはやめよう」と言っていて、出来る限りユーザーやクライアント様に受け入れていただけそうな領域からエージェント化していこう、というのは考えているところです。
秋葉: Sakana AIではそれに関係するようなテーマをいくつか取り組んでいて、そのひとつにインファレンススケーリングがあります。インファレンススケーリングといっても、いろんな種類があって、自分たちなりのちょっと面白いインファレンススケーリングをいくつか研究していて、うまくいけばお披露目できるかと思うので楽しみにしていてください。
松本:ありがとうございます。セッションが終了の時間が来てしまったので、ここで終了とさせてください。改めて宮澤さんと秋葉さん、ありがとうございました!
文=新國翔大
写真=伊藤智哉