Page cover

AI&Businessにようこそ

AIとビジネスの連携のためのオープンナレッジベース

注目のセクション:

業界&ユースケース一覧:

Generated with Midjourney by aiandbusiness.com

業界ニュース&最新動向:

Google Gemini 3

グーグルのAI部門は、新しいフラッグシップモデル「Gemini 3」を発表し、最先端の推論とマルチモーダル機能を搭載—画期的なベンチマークスコアを叩き出し、文脈や深みをより正確に理解し、あらゆるアイデアを実現するためのエージェント機能を強化しました。

ChatGPT Atlas

OpenAI(オープンエーアイ)が新たに発表した「ChatGPT Atlas」は、チャットボット ChatGPT をブラウザに統合したAI搭載ウェブブラウザで、サイドバーでの対話、ページの要約、商品・コンテンツ比較、ユーザー行動に基づくパーソナライズされたメモ機能、さらにはユーザーに代わってウェブ上のタスクを自動的に実行する「エージェントモード」を備え、macOS向けに世界展開され、Windows/iOS/Android版もまもなく登場予定です。

Figure 03

フィギュア社は、完全に再設計された感覚スイート、3グラムの力を感知できる触覚センサー、ワイヤレス充電、安全性向上のソフト素材、量産可能な構造を備えた第三世代ヒューマノイドロボット Figure 03 を発表しました。

OpenAI AgentKit

OpenAIは、新しいAgentKitの一部として、複数のAIエージェントを可視化し、ワークフローを構築・バージョン管理できるAgent Builderを発表しました。

Sora 2

OpenAI(オープンAI)は、10秒のAI生成動画を制作でき、本人認証、リミックス、縦型フィードなどを備えた次世代テキスト→動画モデルとスタンドアロンアプリ Sora 2 を発表しました。

ChatGPT Pulse

OpenAI は、ChatGPT が前夜にあなたの興味・カレンダー・過去の会話を自律的に調査し、翌日に視覚的な更新カードを提示するプロアクティブな「モーニングブリーフィング」体験 ChatGPT Pulse を Pro ユーザー向けに導入しました。

Luma AI Ray3

ルーマAI(Luma AI)は、シーン設計や自己評価、注釈機能などを備えたビジュアル推論能力を持ち、ネイティブの10-/12-/16-bit HDR(ACES2065-1 EXR)動画を生成でき、アイデアを高速に試す「ドラフトモード」も備えた最新の動画生成モデル Ray3 を発表しました。

Notion Agents

ノーションは「Notion 3.0: Agents」を発表し、ドキュメント作成やデータベース管理、複数ステップにわたるワークフローの実行など、人間と同じような作業をこなせるAIエージェントを搭載することで、忙しい作業を自動化し、働き方を根本から変えます。

Google Gemini 2.5 Flash Image (Nano-Banana)

Google DeepMindは、複数の画像を融合し、キャラクターの一貫性を保ちながら、自然言語による変換を可能にし、世界知識を活用して精密な編集を行う最先端の画像生成・編集モデル「Gemini 2.5 Flash Image(Nano-Banana)」を発表しました。

GPT‑5

OpenAIは、思考統合されたルーターによる自動モデル切替、「バイブコーディング」による自然言語からのソフトウェア生成、マルチモーダル対応、高精度かつ誤情報の減少、標準・ミニ・ナノ・プロなど多様なバリアントによるパーソナライズ体験を備えた、これまでで最も高性能な言語モデル「GPT‑5」を公式リリースしました。これは、エージェント的AIやAGIへの大きな前進を意味します。

ElevenLabs Music

エレブンラボ(ElevenLabs)は、新たなAI音楽生成プラットフォーム「Eleven Music」を発表しました。自然言語プロンプトから、スタジオ品質の楽曲(ボーカルまたはインストゥルメンタル)を、多言語で瞬時に生成でき、Merlin NetworkおよびKobaltとのライセンス契約により商用利用にも対応しています。

ChatGPT Study Mode

OpenAI(オープンAI)は、新しい学習モード「ChatGPT Study Mode」をリリースしました。このモードは、ソクラテス式質問、段階的な説明、パーソナライズされたフィードバック、インタラクティブなクイズを通じて、ただ答えを出すのではなく批判的思考と理解を深める支援を行うもので、Free、Plus、Pro、Teamのログインユーザーすべてが利用可能(Eduは今後提供予定)です

ChatGPT Agent

OpenAIは本日、チャットを超えて「仮想コンピュータ」を駆使し、ウェブ閲覧・コーディング・予約・買い物・スプレッドシートやスライド編集など複雑なマルチステップタスクを自律的に処理しつつ、許可プロンプトとWatch Modeなどの安全機能でユーザーの制御を確保する強力なAIアシスタント「ChatGPTエージェント」を発売しました。

Grok 4

Midjourney Video

Midjourneyは、静止画やアップロード画像を5〜21秒の短い動画に変換できる最初のイメージ→ビデオ生成モデル Video V1 をWebおよびDiscordで導入しました。自動・手動指定の動き、GPUコストは画像の約8倍、既存月額プラン(10ドル〜)で利用可能であり、リアルタイム・インタラクティブ世界への道を拓く一歩となっていますが、ディズニーやユニバーサルによる著作権訴訟も継続中です。

ElevenLabs Eleven v3 (alpha)

ElevenLabsは、70以上の言語、感情制御のためのインラインオーディオタグ、およびシームレスなマルチスピーカー会話のための新しいText to Dialogue APIを備えた、これまでで最も表現力豊かなテキスト読み上げモデルであるEleven v3(アルファ版)をリリースしました。これは、映画、オーディオブック、インタラクティブメディアのクリエイターにとって、AI生成音声のリアリズムにおける重要な飛躍を意味します。

Elevenlabs Japan

Last updated

Was this helpful?