7.5 C
Tokyo
Home日本のゲームイベント文章や画像を自動生成する「...

文章や画像を自動生成する「ジェネレーティブAI」の“ゴールドラッシュ”が、いまシリコンバレーで起きている | WIRED.jp


2012年以降に急速に進んだ技術の進歩は、テック業界とそこで提供される製品を再定義した。そのときと同じように、ジェネレーティブAIはAI技術を大きく飛躍させるものだと、Convictionのグオは考えている。

開発者たちは当時、機械学習モデルの一種である人工ニューラルネットワークを見つけ出した。そして、この人工ニューラルネットワークに十分な学習データと演算処理能力を与えれば、画像に写っているものを認識したり、音声を書き起こしたりといった驚くようなスキルを習得できることを突き止めたのである。

それからの数年で、大小さまざまな企業がAIの開発を進めた。おかげで顔認識技術は世界中に広まり、常に話を聞いてくれる音声アシスタントが家庭に導入され、AI技術があらゆるガジェット、アプリ、サービスに埋め込まれるようにもなったのである。

そしていま、世界的に有用なジェネレーティブAIのアプリケーションを探す競争が始まっている。初期の成功例のひとつは、月額10ドルで与えられたタスクを処理するコードを書くマイクロソフト傘下のGitHubのサービス「GitHub Copilot」だ。

もうひとつは、企業のブログ投稿やマーケティング用の文言、電子メールで使う文章を自動生成するサービスを提供するJasperである。同社が投資家から時価総額が15億ドルと評価され、1億2,500万ドルを調達したと発表したのは10月中旬のことだ。今年の売上は7,500万ドルに達する見込みであると、同社は主張している

火付け役となったOpenAI

GitHub CopilotもJasperも、OpenAIのサービスを基に構築されている。OpenAIは、イーロン・マスクをはじめとするテクノロジー業界の著名人が出資し、非営利団体として設立された組織だ。

そのOpenAIは、19年に発表した「GPT-2」と呼ばれるアルゴリズムを皮切りに、テキスト生成の分野を牽引している。さらに強力な商用の後継サービス「GPT-3」を誰でも使えるように開放したのは、21年終盤のことだ。

またOpenAIは、文章による指示で画像を生成するツール「DALL-E」を21年1月に発表し、最近のAIによる画像生成への関心に火を付けた。改良バージョン「DALL-E 2」は22年4月に発表している。

DALL-E 2では、より洗練された複雑な画像を生成することができ、技術の進歩の速さを示した。とはいえ、いまではStability AIをはじめ多くの企業が、同様の画像生成ツールを提供している。

シリコンバレーの盛り上がりに現実が追いついていない部分も多々ある。「FOMO(取り残される恐怖)も広がっています」と、Air Street Capitalの投資家でテクノロジーとビジネスのトレンドを追跡する年次レポート「The State of AI」の著者でもあるネイサン・ベネイクは指摘する。

アドビがコラボレーティブデザインツール「Figma」を200億ドルで買収したことで、クリエイティブツールの再発明の分野に多くのビジネスチャンスがあるという認識が広がったと、ベネイクは語る。ベネイク自身は、タンパク質合成や化学の分野でジェネレーティブAIの活用を検討しているいくつかの企業に注目しているという。「いまはとてもおかしな状況で、誰もがこの話題について話しています」

規制に向けた動きや法的な問題も続出

Foundation Capitalのパートナーで、Jasperに早くから投資していたジョアン・チェンは、ジェネレーティブAIツールを提供するスタートアップを価値ある企業にすることはまだ難しいと言う。Jasperの創業者たちは、顧客のニーズや好みに合わせて製品を微調整することにほとんどの労力を費やしているが、この技術はさまざまな用途に使えるはずだとチェンは考えているという。

また、ジェネレーティブAIは普及しつつあるが、好ましくない使い方や危険な使い方に対する規制が追いついていないともチェンは指摘する。例えば、誤報を広める動画の作成などにAIツールが悪用されることを、チェンは懸念している。「わたしが最も懸念しているのは、セキュリティ対策や虚偽、あるいは偽造されたコンテンツにどう対処するかという点です」



Source link

最新記事

もっと探る