Gemini (言語モデル)

Googleの開発した大規模言語モデル

Gemini(ジェミニ)は、Google DeepMindによって開発されたマルチモーダル英語版大規模言語モデルのファミリーであり、LaMDAおよびPaLM2の後継として供する。(2023年12月6日に発表された)Gemini Ultra、Gemini Pro、Gemini Nanoからなり、OpenAIGPT-4のライバルとして位置付けられた。

Gemini
開発元 Google DeepMind
初版 2023年12月6日 (4か月前) (2023-12-06)
対応言語 英語
種別 大規模言語モデル
ライセンス プロプライエタリ
公式サイト deepmind.google/technologies/gemini/#introduction ウィキデータを編集
テンプレートを表示

歴史 編集

開発 編集

Googleは、2023年5月10日のGoogle I/O基調講演の期間中(子会社のGoogle DeepMindによって開発された大規模言語モデル(LLM)である)Geminiを発表した。これは、GoogleのCEOサンダー・ピチャイによると「Geminiはまだ初期の開発段階にある」と述べるものの(同イベントでも、お披露目された)PaLM2のより強力な後継として位置付けられていた[1][2]。他のLLMとは異なり、Geminiはテキスト・コーパスのみでトレーニングされておらず、テキスト、画像、音声、映像、そしてコンピュータ・コードを含む、異なる種類のデータを同時に処理できることを意味するマルチモーダル英語版になるように設計されている点でユニークであると言われている[3][4]。これはGoogle DeepMindとして先月統合されたGoogleの2部門であるDeepMindとGoogle Brain英語版のコラボレーションとして開発された[5]Wired誌とのインタビューで、DeepMindのCEOデミス・ハサビスは、その人気ぶりがGoogleにLaMDABardを使ってアグレッシブに挑戦させてきたOpenAIGPT-4で動くChatGPTを自社のアルゴリズムで打ち負かすことが可能であると彼が信じたGeminiの高度な能力を押し売りした。ハザビスいわくGeminiはAlphaGoとその他のGoogle=DeepMind製LLMの力を組み合わせるだろうとし、(2016年に囲碁チャンピョンのイ・セドルを負かしたとき世界中の注目を得た)DeepMindのAlphaGoプログラムの強さを強調した[6]

2023年8月、The Information英語版はGeminiについてGoogleのロードマップを要約したレポートを発表し、同社が2023年後半のローンチを目標にしていることを明らかにした。レポートによると、Googleは現在大抵のLLMに備わっている会話型テキスト能力を人工知能を駆使した画像生成と組み合わせて、コンテキストに応じた画像作成を可能にし、より広範囲のユースケースに適応されることで、OpenAIやその他競合他社を凌駕したいと望んでいた[7]。Bardと同様に[8]、Googleの共同創設者であるセルゲイ・ブリンも、Google Brain英語版とDeepMindのその他何百人ものエンジニアとともに、Geminiの開発を支援するためにセミリタイア生活から召喚された[7][9]。GeminiはYouTubeの動画のトランスクリプト(文字起こし)でも訓練を受けていたため、如何なる潜在的に著作権保護されている素材を排除するために弁護士も連れてこられた[7]

Geminiのローンチが差し迫っているというニュースを受けて、OpenAIはGPT4をGeminiと同様のマルチモーダル機能と統合する作業を急かした[10]The Information が9月に報じたところによると、数社がGoogle CloudのVertex AIサービス経由でクライアントに利用可能にさせることをGoogleが企図していたLLMの「初期バージョン」への早期アクセスを承諾されていた。この報告は、GoogleがGPT4とマイクロソフトGitHub Copilot両方諸共打ち負かすためにGeminiを武装させていることも同様に言及されていた[11][12]。12月2日、同誌はGoogleは英語以外のプロンプトに問題があるため、Geminiのローンチを翌週から2024年1月に延期し、付け加えて3つのローンチ・イベントがニューヨーク市、ワシントンD.C.、そしてカリフォルニアで計画されていたと報告した[13][14]

ローンチ 編集

2023年12月6日、ピチャイとハサビスはバーチャル記者会見で「Gemini 1.0」を発表した[15][16]。これは3つのモデルでから成っていた:「非常に複雑なタスク」向けに設計された、Gemini Ultra;「幅広いタスク」向けに設計された、Gemini Pro; そして「オン=デバイス・タスク」用に設計された、Gemini Nano。ローンチ時に、Gemini Proと(Gemini )NanoはBardとPixel 8 Proスマートフォンにそれぞれ統合されたが、一方Gemini Ultraは「Bard Advanced」を強化し、2024年初めにソフトウェア開発者が利用可能になる。GoogleがGeminiを組み込むことを企図していたその他製品には、検索広告ChromeGoogle Workspace上のDuet AI、そしてAlphaCode2英語版が含まれていた[17][16]。それ(ら)は英語(版)のみ利用可能となった[16][18]。Googleに「最大かつ最も有能なAIモデル」として押し売りされ、人間の行動をエミュレートするように設計された[19][16][20](それについて)同社は、Geminiには「広範囲にわたる安全性のテスト」の必要性により、翌年まで幅広く利用できるようにはならないだろうと述べた[15]。GeminiはGoogleのテンソル・プロセッシング・ユニット(TPU)でトレーニングされ、そして駆動させており[15][18]、その名前はDeepMindとGoogle Brainの合併およびNASAジェミニ計画にちなんで付けられている[21](※ジェミニの意味は、ふたご座)。

Gemini Ultraは、さまざまな業界ベンチマークでGPT4、AnthropicClaude2Inflection AI英語版のInflection2、MetaLLaMA2xAIGrok1よりもアウトパフォームしたと言われる[22][15]一方、Gemini ProはGPT-3.5よりアウトパフォームしたと言われていた[4]。Gemini Ultraも同じく、57科目の大規模マルチタスク言語理解(MMLU)テストで人間の専門家を上回り、90%のスコアを獲得した最初の言語モデルでもあった[4][21]。Gemini Proは12月13日にAI StudioとVertex AIでGoogle Cloudの顧客に利用できるようになり、一方でGemini NanoはAndroid開発者にも利用できるようになる[23][24][25]。ハサビスはさらに、DeepMindがGeminiを「ロボット工学と組み合わせて世界と物理的に対話する」方法を模索していることを明らかにした[26]。10月にジョー・バイデン大統領が署名した大統領令14110英語版に従って、GoogleはGemini Ultraのテスト結果をアメリカ合衆国連邦政府と共有すると述べた。同様に、同社は11月にブレッチリー・パークで開催されたAI安全サミット英語版で定められた原則を遵守するためにイギリス政府との協議に取り組んでいる[4]

レセプション 編集

GeminiのローンチはMITテクノロジーレビュー が「AIの誇大広告」と揶揄した、数か月にわたる激しい憶測と期待によって予期されていた[27][22]。2023年8月、調査会社セミアナリシス(SemiAnalysis)のディラン・パテル(Dylan Patel)氏とダニエル・ニッシュボール(Daniel Nishball)氏が、Geminiのリリースが「世界を食い尽くし」そしてGPT4を追い落とす(outclass)と宣言するブログ投稿を書き、OpenAIのCEOサム・アルトマンX(旧Twitter)でこの二人を即座に嘲笑することになった[28][29]イーロン・マスク(OpenAIの共同創設者)も加勢し、「数字は間違っているのか?("Are the numbers wrong?")」と尋ねたうえ[30]Business Insider のヒュー・ラングレー(Hugh Langley)はGeminiがGoogleにとって運命を左右する瞬間になるだろうと述べ、次のように書いた:「もしGeminiが眩惑するなら(※原文: dazzles、星座に引っ掛けたダジャレ)、それはGoogleがMicrosoftとOpenAIによって盲点を突かれたという物語を変えるのに役立つだろう。逆にそれが期待外れだったら、Googleは遅れをとっているという批判家たちを勢い付かせることになるだろう。」[31]

2023年12月のお披露目に際して、ワシントン大学オーレン・エツィオーニ英語版名誉教授は、GoogleとOpenAI間の「軍拡競争の応酬」を予測した。カリフォルニア大学バークレー校教授のアレクセイ・エフロス英語版はGeminiのマルチモーダルなアプローチの可能性を賞賛し[21]、一方サンタフェ研究所の科学者メラニー・ミッチェル英語版はGeminiを「非常に洗練されている」と評した。ワシントン大学のチラグ・シャー(Chirag Shah)教授は、GeminiのローンチをApple毎年発表する新しいiPhoneに喩え、それほど感銘を受けなかった。同様に、スタンフォード大学のパーシー・リアン(Percy Liang)とワシントン大学のエミリー・ベンダー英語版は、使用されたトレーニングデータについての洞察がなければベンチマークスコアを解釈するのは難しいと警告した[27]

日本での利用 編集

2024年2月1日、Bardの日本語版でもGemini Proが利用できるようになった[32]

脚注 編集

  1. ^ Grant, Nico (2023年5月10日). “Google Builds on Tech's Latest Craze With Its Own A.I. Products”. The New York Times. ISSN 0362-4331. オリジナルの2023年5月10日時点におけるアーカイブ。. https://web.archive.org/web/20230510180605/https://www.nytimes.com/2023/05/10/technology/google-ai-products.html 2023年8月21日閲覧。 
  2. ^ Ortiz, Sabrina (2023年5月10日). “Every major AI feature announced at Google I/O 2023”. ZDNet. 2023年5月10日時点のオリジナルよりアーカイブ。2023年8月21日閲覧。
  3. ^ Wankhede, Calvin (2023年6月4日). “What is Google Gemini: The next-gen language model that can do it all”. Android Authority. 2023年6月5日時点のオリジナルよりアーカイブ。2023年8月21日閲覧。
  4. ^ a b c d Milmo, Dan (2023年12月6日). “Google says new AI model Gemini outperforms ChatGPT in most tests”. The Guardian. ISSN 0261-3077. オリジナルの2023年12月6日時点におけるアーカイブ。. https://web.archive.org/web/20231206162533/https://www.theguardian.com/technology/2023/dec/06/google-new-ai-model-gemini-bard-upgrade 2023年12月6日閲覧。 
  5. ^ Levy, Steven (September 11, 2023). “Sundar Pichai on Google;s AI, Microsoft's AI, OpenAI, and ... Did We Mention AI?”. Wired. オリジナルのSeptember 11, 2023時点におけるアーカイブ。. https://web.archive.org/web/20230911124432/https://www.wired.com/story/sundar-pichai-google-ai-microsoft-openai/ 2023年9月12日閲覧。. 
  6. ^ Knight, Will (June 26, 2023). “Google DeepMind's CEO Says Its Next Algorithm Will Eclipse ChatGPT”. Wired. オリジナルのJune 26, 2023時点におけるアーカイブ。. https://web.archive.org/web/20230626121231/https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/ 2023年8月21日閲覧。. 
  7. ^ a b c Victor, Jon (2023年8月15日). “How Google is Planning to Beat OpenAI”. The Information. 2023年8月15日時点のオリジナルよりアーカイブ。2023年8月21日閲覧。
  8. ^ Grant, Nico (2023年1月20日). “Google Calls In Help From Larry Page and Sergey Brin for A.I. Fight”. The New York Times. ISSN 0362-4331. オリジナルの2023年1月20日時点におけるアーカイブ。. https://web.archive.org/web/20230120081118/https://www.nytimes.com/2023/01/20/technology/google-chatgpt-artificial-intelligence.html 2023年2月6日閲覧。 
  9. ^ Kruppa, Miles; Seetharaman, Deepa (2023年7月21日). “Sergey Brin Is Back in the Trenches at Google”. The Wall Street Journal. ISSN 0099-9660. オリジナルの2023年7月21日時点におけるアーカイブ。. https://archive.today/2023.07.21-010618/https://www.wsj.com/amp/articles/sergey-brin-google-ai-gemini-1b5aa41e 2023年9月7日閲覧。 
  10. ^ Victor, Jon (2023年9月18日). “OpenAI Hustles to Beat Google to Launch 'Multimodal' LLM”. The Information. 2023年9月18日時点のオリジナルよりアーカイブ。2023年10月15日閲覧。
  11. ^ “Google nears release of AI software Gemini, The Information reports”. Reuters. (2023年9月14日). オリジナルの2023年9月15日時点におけるアーカイブ。. https://web.archive.org/web/20230915113109/https://www.reuters.com/technology/google-nears-release-ai-software-gemini-information-2023-09-15/ 2023年10月2日閲覧。 
  12. ^ Nolan, Beatrice (2023年9月23日). “Google is quietly handing out early demos of its GPT-4 rival called Gemini. Here's what we know so far about the upcoming AI model.”. Business Insider. 2023年9月23日時点のオリジナルよりアーカイブ。2023年10月16日閲覧。
  13. ^ Google Preps Public Preview of Gemini AI After Postponing In-Person Launch Events”. The Information (2023年12月2日). 2023年12月2日時点のオリジナルよりアーカイブ。2023年12月6日閲覧。
  14. ^ Tangalakis-Lippert, Katherine (2023年12月2日). “Google has quietly pushed back the launch of next-gen AI model Gemini until next year, report says”. Business Insider. 2023年12月3日時点のオリジナルよりアーカイブ。2023年12月6日閲覧。
  15. ^ a b c d Kruppa, Miles (2023年12月6日). “Google Announces AI System Gemini After Turmoil at Rival OpenAI”. The Wall Street Journal. ISSN 0099-9660. オリジナルの2023年12月6日時点におけるアーカイブ。. https://archive.today/2023.12.06-152820/https://www.wsj.com/tech/ai/google-announces-ai-system-gemini-after-turmoil-at-rival-openai-10835335 2023年12月6日閲覧。 
  16. ^ a b c d Liedtike, Michael; O'Brien, Matt (2023年12月6日). “Google launches Gemini, upping the stakes in the global AI race”. Associated Press. オリジナルの2023年12月6日時点におけるアーカイブ。. https://web.archive.org/web/20231206181414/https://apnews.com/article/google-gemini-artificial-intelligence-launch-95d05d02051e75e20b574614ae720b8b 2023年12月6日閲覧。 
  17. ^ Edwards, Benj (2023年12月6日). “Google launches Gemini—a powerful AI model it says can surpass GPT-4”. Ars Technica. 2023年12月6日時点のオリジナルよりアーカイブ。2023年12月6日閲覧。
  18. ^ a b Pierce, David (2023年12月6日). “Google launches Gemini, the AI model it hopes will take down GPT-4”. The Verge. 2023年12月6日時点のオリジナルよりアーカイブ。2023年12月6日閲覧。
  19. ^ Google launches Gemini, its most-advanced AI model yet, as it races to compete with ChatGPT”. CNN Business (2023年12月6日). 2023年12月6日時点のオリジナルよりアーカイブ。2023年12月6日閲覧。
  20. ^ Google launches Gemini, upping the stakes in the global AI race”. CBS News (2023年12月6日). 2023年12月7日時点のオリジナルよりアーカイブ。2023年12月7日閲覧。
  21. ^ a b c Knight, Will (December 6, 2023). “Google Just Launched Gemini, Its Long-Awaited Answer to ChatGPT”. Wired. オリジナルのDecember 6, 2023時点におけるアーカイブ。. https://web.archive.org/web/20231206151324/https://www.wired.com/story/google-gemini-ai-model-chatgpt/ 2023年12月6日閲覧。. 
  22. ^ a b Henshall, Will (2023年12月6日). “Google DeepMind Unveils Its Most Powerful AI Offering Yet”. 2023年12月6日時点のオリジナルよりアーカイブ。2023年12月6日閲覧。
  23. ^ Metz, Cade; Grant, Nico (2023年12月6日). “Google Updates Bard Chatbot With 'Gemini' A.I. as It Chases ChatGPT”. The New York Times. ISSN 0362-4331. オリジナルの2023年12月6日時点におけるアーカイブ。. https://web.archive.org/web/20231206153133/https://www.nytimes.com/2023/12/06/technology/google-ai-bard-chatbot-gemini.html 2023年12月6日閲覧。 
  24. ^ Elias, Jennifer (2023年12月6日). “Google launches its largest and 'most capable' AI model, Gemini”. CNBC. 2023年12月6日時点のオリジナルよりアーカイブ。2023年12月6日閲覧。
  25. ^ Google Opens Access to Gemini, Racing to Catch Up to OpenAI”. Bloomberg News (2023年12月6日). 2023年12月6日時点のオリジナルよりアーカイブ。2023年12月7日閲覧。
  26. ^ Knight, Will (December 6, 2023). “Google DeepMind's Demis Hassabis Says Gemini Is a New Breed of AI”. Wired. オリジナルのDecember 6, 2023時点におけるアーカイブ。. https://web.archive.org/web/20231206153212/https://www.wired.com/story/google-deepmind-demis-hassabis-gemini-ai/ 2023年12月7日閲覧。. 
  27. ^ a b Heikkilä, Melissa; Heaven, Will Douglas (December 6, 2023). “Google DeepMind’s new Gemini model looks amazing—but could signal peak AI hype”. MIT Technology Review. オリジナルのDecember 6, 2023時点におけるアーカイブ。. https://web.archive.org/web/20231206175747/https://www.technologyreview.com/2023/12/06/1084471/google-deepminds-new-gemini-model-looks-amazing-but-could-signal-peak-ai-hype/ 2023年12月6日閲覧。. 
  28. ^ howdhury, Hasan (2023年8月29日). “AI bros are at war over declarations that Google's upcoming Gemini AI model smashes OpenAI's GPT-4”. Business Insider. 2023年8月29日時点のオリジナルよりアーカイブ。2023年9月7日閲覧。
  29. ^ Harrison, Maggie (August 31, 2023). “OpenAI Rages at Report that Google's New AI Crushes GPT-4”. Fortune. オリジナルのAugust 31, 2023時点におけるアーカイブ。. https://web.archive.org/web/20230831232156/https://futurism.com/the-byte/openai-report-google-ai-gpt-4 2023年9月7日閲覧。. 
  30. ^ Musk, Elon [@elonmusk] (2023年8月29日). "Are the numbers wrong?". 2023年9月1日時点のオリジナルよりアーカイブX(旧Twitter)より2023年10月15日閲覧
  31. ^ Langley, Hugh (2023年10月12日). “Google VP teases Gemini's multimodal future: 'I've seen some pretty amazing things.'”. Business Insider. 2023年10月12日時点のオリジナルよりアーカイブ。2023年10月15日閲覧。
  32. ^ 日本語の Bard でも Gemini Pro が利用可能に。 あわせて、回答を確認するダブルチェック機能も公開。”. Google Japan Blog. Google (2024年2月2日). 2024年2月2日時点のオリジナルよりアーカイブ。2024年2月2日閲覧。

参考文献 編集

関連項目 編集

外部リンク 編集