2024年12月の生成AI最新ニュースまとめ

ブログ004のOGP画像:2024年12月の生成AI最新ニュースまとめ


2024年12月の生成AI最新ニュースまとめ


記事概要

2024年12月、生成AI業界では革新的な発表や技術進化が次々と報じられました。本記事では、特に注目された最新ニュースをピックアップし、その意義や今後の展望について解説します。


このような方におすすめです

  • 生成AIの最新動向を知りたい方
  • AIを活用したビジネス展開を検討している方
  • 動画制作やアート分野で生成AIを活用したい方
  • AIモデル開発や研究に携わる方
  • 生成AIを教育や研究に取り入れたい方
  • 国際的なAIガバナンスや倫理問題に関心のある方
  • 企業の生成AI活用事例に興味がある方



TOPICS



Google

NotebookLM PlusとGoogle Agentspaceを発表

12月16日、Googleは「NotebookLM Plus」を発表。音声インタラクション機能と「Gemini 2.0 Flash」を統合し、文書管理や情報検索の精度と利便性を向上させました。さらに翌日には、業務効率化を支援する新AIサービス「Google Agentspace」も発表されました。

Google Cloud、Google Agentspace と NotebookLM Plus で企業の生産性向上を支援


Gemini 2.0 Flash Thinkingを公開

12月19日、Googleは「Gemini 2.0 Flash Thinking」を発表。問題解決プロセスを人間が理解しやすい形で提示し、推論能力やマルチモーダル理解、コーディング機能を強化しました。


動画生成AI「Veo2」を発表

12月16日、Googleは、動画生成AI「Veo2」を発表しました。4K解像度の動画生成に対応し、リアルタイム編集やシーン分析機能を搭載。クリエイターにとって、新たな映像制作ツールとして大きな期待が寄せられています。

State-of-the-art video and image generation with Veo 2 and Imagen 3

Veo2
Veo2


OpenAI

推論AIモデル「o3」と「o3-mini」を発表

12月20日、OpenAIは最新の推論AIモデル「o3」と「o3-mini」を発表しました。これらのモデルは複雑な問題解決能力を大幅に向上させ、数学やプログラミング分野で人間の専門家を上回る性能を示しています。特に、o3モデルはARC-AGIベンチマークで87.5%という驚異的なスコアを記録し、次世代の汎用AIに向けた重要な一歩といえるでしょう。


動画生成AI「Sora Turbo」を一般提供開始

12月10日、OpenAIは「Sora Turbo」の一般提供を開始。テキストから最長20秒のHD動画を生成し、1080p高画質出力に対応しています。「Remix」「Re-cut」などの新機能も追加され、クリエイティブな表現の幅が広がりました。

Sora Turbo
Sora Turbo


AI Picasso

Emi 3を無償公開

12月16日、AI Picassoは高品質なAIアート生成モデル「Emi 3」を商用利用も可能な形で無償公開しました。イラストやアニメ、マンガ制作をターゲットにしており、クリエイティブ業界における生成AIのさらなる普及が期待されています。

Emi3
Emi3で生成した画像


NVIDIA

Jetson Orin Nano Superを発表

12月18日、NVIDIAは、AI処理性能を70%向上させつつ価格を半減した「Jetson Orin Nano Super」をリリース。これにより、多くの開発者が生成AIを活用できる環境が整いました。


楽天

日本人向けに最適化された新AIモデルを発表

12月18日、楽天グループ株式会社は、日本語に最適化された大規模言語モデル(LLM)「Rakuten AI 2.0」と、小型言語モデル(SLM)「Rakuten AI 2.0 mini」を発表しました。


名古屋鉄道

生成AI大賞2024でグランプリ受賞

12月18日、名古屋鉄道は3つのレイヤーを用いた「生成AI活用プロジェクト」により、「生成AI大賞2024」のグランプリを受賞しました。この受賞は、生成AIの企業活用における模範例として広く注目されています。


よくある質問

Q1. NotebookLM Plus とは?

🅰 NotebookLM Plus は、Google が提供する AI 搭載のノート作成ツール「NotebookLM」の有料プランです。無料版の NotebookLM に加えて、様々な機能や特典が利用できます。

NotebookLM と NotebookLM Plus の相違点


Q2. Gemini 2.0 Flashとは?

🅰 Gemini 2.0 Flash は、Google が開発した最新の生成 AI モデルです。マルチモーダル機能※を備えており、テキスト、画像、音声、動画など様々な形式のデータを処理できます。特に、高速な応答速度と高い性能が特徴です。

※マルチモーダル機能:AI(人工知能)がテキスト、画像、音声、動画など、複数の種類の情報を組み合わせて処理し、理解したり生成したりする能力のこと。


Q3. Google Agentspaceとは?

🅰 Google Agentspaceは、Googleが提供する企業向けのAIプラットフォームです。大規模言語モデル「Gemini」を基盤とし、企業内の様々なデータソースを統合して、従業員が求める情報を迅速かつ正確に提供できるAIエージェントを構築・運用するための環境を提供します。


Q4. Gemini 2.0 Flash Thinkingとは?

🅰 Googleが開発した「Gemini 2.0 Flash Thinking」は、AIが問題を解決する際の思考プロセスを可視化する機能を持っています。これにより、AIがどのようにして回答にたどり着いたのかを理解しやすくなっており、教育や研究分野での活用が期待されています。

「Gemini 2.0 Flash」は高速な応答速度とマルチモーダル処理能力を備えた「日常的なタスク」をサポートする生成AIモデルであるのに対し、「Gemini 2.0 Flash Thinking」はその思考プロセスを可視化し、AIがどのように問題解決に至ったのかを理解できる「推論」に特化しています。

Gemini 2.0 Flash Thinking Experimental: A Guide With Examples


Q5. 今回紹介された生成AIモデルは誰でも使えますか?

🅰 はい、多くのモデルは一般ユーザーでも利用できますが、提供形態や利用条件はモデルごとに異なります。たとえば、Googleの「NotebookLM Plus」や「Google Agentspace」は企業向けの機能も多く含まれていますが、NotebookLM Plusは有料プランに登録すれば個人でも利用可能です。

また、「Gemini 2.0 Flash」や「Gemini 2.0 Flash Thinking」は、GeminiなどのGoogleの特定のサービスを通じて利用できます。OpenAIの「Sora Turbo」は一般提供が開始されており、誰でもテキストからHD動画を生成する機能を体験できます。

ただし、「o3」や「o3-mini」は高度な推論AIモデルであり、現時点では特定の開発者や研究者向けの提供が中心です。さらに、AI Picassoの「Emi 3」は商用利用も可能な形で無償公開されており、クリエイターが自由に使えることから、イラストやマンガ制作を行う方にもおすすめです。


Q6. Veo2とSora Turboの違いは何ですか?

🅰 Veo2はGoogleが開発した動画生成AIで、4K解像度の動画生成に対応しており、リアルタイム編集やシーン分析機能を備えています。一方で、OpenAIの「Sora Turbo」はテキストから最長20秒のHD動画を生成でき、RemixやStoryboardなどの機能を使ってクリエイティブな動画作成をサポートします。両者とも動画生成AIですが、「Veo2」は高品質な動画制作向き、「Sora Turbo」は手軽で短時間の動画作成に適しています。


Q7. o3とo3-miniの主な用途は何ですか?

🅰 o3とo3-miniは、数学やプログラミングなど複雑な問題を解決するために開発された高度な推論能力を持つAIモデルです。特に「o3」は、次世代の汎用AIとして期待されており、人間の専門家レベルを超えるパフォーマンスを発揮します。「o3-mini」は軽量版で、よりコンパクトな環境でも効率的に動作できるよう設計されています。


Q8. Jetson Orin Nano Superは何に使えますか?

🅰 NVIDIAの「Jetson Orin Nano Super」は、AI処理能力を70%向上させた開発者向けのキットです。低価格でありながら高性能なため、AI搭載ロボットやIoTデバイスの開発、AI学習用のプロジェクトなど、幅広い用途に適しています。

NVIDIA が、最も手に入れやすい価格の生成 AI スーパーコンピューターを発表


Q9. Rakuten AI 2.0の特徴は?

🅰 楽天が発表した「Rakuten AI 2.0」は、日本語に最適化された大規模言語モデルで、AIアプリケーション開発を支援するために設計されています。Mixture of Experts(MoE)アーキテクチャを採用しており、高効率かつ高性能な日本語処理を実現します。

楽天、日本語に最適化した大規模言語モデルと楽天初の小規模言語モデルを提供開始


Q10. 生成AI大賞2024とは?

🅰 「生成AI大賞2024」は、一般社団法人Generative AI Japanが主催し、デジタル庁、経済産業省、文部科学省が後援する、日本国内の優れた生成AIの活用事例を表彰するアワードです。初めて開催された2024年には、139件の応募があり、「課題設定」、「実装の工夫」、「インパクト」、「ガバナンス」、「将来性」という5つの基準に基づいて審査が行われました。このアワードは、日本における生成AIの活用促進と、その優れた事例の共有を目的としており、他にも7つの団体が受賞しています。


まとめ

2024年12月は、生成AIの可能性と応用範囲を広げる重要な月となりました。企業や開発者だけでなく、クリエイターや一般ユーザーも生成AIの進化を活用できる環境が整いつつあります。今後も生成AIの発展から目が離せません。

このブログの人気の投稿

Bloggerで始める無料ブログの開設・カスタマイズ方法

無料の画像生成AI「Google Image FX」とは?を簡単に解説