ジェミニ 1 プロ

Gemini 1.5 Pro アップデートにより、AI がコンテンツをリッスンして生成するようになりました

ジョアン・ルーカス・バティスタのアバター
新しいアップデートにより、Google の人工知能が音声を理解して分析できるようになりました。 Imagen 2 では、画像要素を追加および削除し、4 秒の GIF を作成できるようになりました。

A Google 人工知能、または 双子座、今週火曜日、4 月 9 日に、新しく革新的なアップデートを受け取りました。 Google CloudNext。アップグレードにより、 ジェミニ 1.5 プロ、オーディオとビデオのラインを理解して分析し、アプリケーションに入力された内容に基づいてコンテンツを作成する機能を受け取りました。

当初、この新機能は、 頂点AI、を対象としたソフトウェア 機械学習 (機械学習)、プログラマーや科学者が新しい AI を開発するために使用します。

Google の AI である Gemini は何をするのでしょうか?

Gemini 1 pro アップデートにより、ia がコンテンツをリッスンして生成できるようになります。新しいアップデートにより、Google の人工知能が音声を理解して分析できるようになりました。 Imagen 5 は画像要素を追加および削除し、2 秒の GIF を作成できるようになりました。
ジェミニインターフェイス。画像: ルーカス・ゴメス/ショーミーテック

O 双子座、Googleの人工知能は昨年12月に発売され、 吟遊詩人の代わりに、コーディングから洗練された論理的推論まで、非常に複雑なタスクを処理できる能力が際立っています。

人工知能は、さまざまな種類の情報を整理するだけでなく、それらを組み合わせる目的で、さまざまなファイルを操作する、最も多様なタスクでユーザーを支援できる機能を備えています。その機能により、次のようなさまざまなコンテンツ形式を使用できます。

  • テキスト。
  • 画像;
  • オーディオ;
  • ビデオ。それは
  • プログラミング言語。

O 双子座 これには、異なる特性を持つ 3 つの動作モードがあります。

  • ジェミニウルトラ — より大きく、非常に複雑なタスクに対応できる能力が高くなります。
  • ジェミニプロ — さまざまなタスクの拡張に最適です。
  • ジェミニナノ — モバイルタスクの効率が向上します。

Gemini 1.5 Pro アップデートとその新機能

Gemini 1 pro アップデートにより、ia がコンテンツをリッスンして生成できるようになります。新しいアップデートにより、Google の人工知能が音声を理解して分析できるようになりました。 Imagen 5 は画像要素を追加および削除し、2 秒の GIF を作成できるようになりました。
ジェミニIA。画像: rafares/Shutterstock)

テクノロジーの巨人が発表したこの新しいモデルは、パフォーマンスと長いコンテキストの理解が向上し、以前のモデルと比較して大幅な進歩を示しています。 ジェミニ 1.5 プロは、テスト用に公開された初期バージョンで、さまざまなタスク向けに最適化されており、計算の点でより効率的で、より堅牢なバージョンであり、さらに複雑なアクティビティの要件を満たすことができます。

さらに、 ジェミニ 1.5 プロ 実験的なリソースが含まれており、理論的には最大で次の処理が可能です。 1万トークン 大規模なベースモデルにとって、これは革新的なものとなるでしょう。 Google によると、この膨大な量は 700.000 ワードと 30.000 行のコード、これは以下と同等です XNUMX時間のビデオ ou 11時間の音声.

Gemini 1.5 Pro の新しいツールにより、アプリケーションは、 Google AIスタジオ、コンテンツ制作が容易になります。公式情報によると、Google の AI アップデートは以下のバージョンで利用可能です。 180国 Gemini API (ポルトガル語でアプリケーション プログラミング インターフェイス) を介して、オーディオを理解する前例のないネイティブ機能と、ファイル処理を容易にする新しい API を備えています。

このリリースでは、新しいシステム命令とモード機能も備えています。 JSONの (コンピュータ システム間で情報を交換するための軽量データ形式)。新しいアップデートの可能性を信じて、Googleはテキスト埋め込みモデルが同様の機能を備えた競合他社よりも優れていることを約束します。

O ジェミニ 1.5 プロ 現在は以下の方法でのみ利用可能です 頂点AI.

Imagen 2 は GIF を作成できます

イベント中 Google CloudNext、もう一つの重要な発表がGoogleによって行われました:AIモデル Imagenと2、画像と短いビデオを生成できます。 プロンプト テキストの。これにより、さまざまなカメラアングルから最大4秒のGIFを作成でき、動きも表示できる。

このツールとの違いはまさに探索の可能性です。 さまざまな角度、シーンにダイナミズムが加わり、静止した写真と限られた動きで生成された AI ビデオをはるかに超えています。

Vertex IA の Imagen 2 からの作成例。ビデオ: Google Cloud/YouTube

O Imagenと2 ライブ画像とも呼ばれるビデオクリップを低解像度で生成する機能があります 640 x 360。さらに、Googleはその技術を使用しています シンセID を適用する 目に見えない透かし AI が生成したクリップと画像。同社は次のように主張しています。 シンセID 編集や圧縮もサポートでき、プロモーションを目的とした対策も可能 データセキュリティ.

現在までに、次のリソースは、 Imagenと2 を通じてのみ利用可能です 頂点AIこれには、内部および外部ペイントのサポートに加え、AI を使用して画像を編集する機能が含まれており、境界線を拡大したり、画像の特定の部分を追加/削除したりすることができます。マーケティング専門家やキャンペーン用のコンテンツ作成、その他の広告作品や動画プラットフォームを対象としたツール。

頂点AI

Gemini 1 pro アップデートにより、ia がコンテンツをリッスンして生成できるようになります。新しいアップデートにより、Google の人工知能が音声を理解して分析できるようになりました。 Imagen 5 は画像要素を追加および削除し、2 秒の GIF を作成できるようになりました。
Vertex AI プラットフォーム。画像: Google/複製

O 頂点AI プラットフォームです 機械学習 AI を活用したアプリケーションで使用する大規模言語モデル (LLM) のカスタマイズなど、AI ツールとアプリケーションのトレーニングと展開を可能にする (ML)。

このプラットフォームは Google のさまざまな機能とアプリケーションをコンパイルし、データ エンジニアリング、データ サイエンス、データ エンジニアリングのワークフローを統合します。 機械学習、共通のツール セットを通じてチーム間のコラボレーションが可能になるだけでなく、Google Cloud の利点を活用してアプリケーションをスケーリングすることもできます。

A 頂点AI モデルのトレーニングとデプロイのためのいくつかのオプションを提供します。

  • AutoML コードを記述したり、データ分割を準備したりすることなく、表形式、画像、テキスト、またはビデオ データをトレーニングできます。
  • パーソナライズされたトレーニングにより、トレーニング プロセスを完全に制御できます。 フレームワーク 好みの ML コード、独自のトレーニング コーディング、およびハイパーパラメータ調整オプションの選択。
  • モデルガーデン モデルの選択やオープン ソース リソース (OSS) を含む、Vertex AI モデルの検出、テスト、カスタマイズ、デプロイを可能にします。
  • A ジェネレーティブAI 複数のモダリティ (テキスト、コード、画像、音声) で Google の大規模な生成 AI モデルへのアクセスを提供します。 Google LLM をニーズに合わせて調整し、AI を活用したアプリケーションで使用できるようにデプロイできます。

ソース: ベルジェ, 開発者向け Google, トムのガイド, ビーボム, Google Cloud

以下も参照してください。

によってレビュー グラウコンバイタル 10/4/24。


Showmetech について詳しく知る

最新ニュースを電子メールで受け取るには登録してください。

関連する投稿