詳細なテキストを入力してしばらく待つと、書かれた説明に基づいて、インターネット上で見たことのない画像が生成されます。 このように説明できます 画像、新しい AI グーグル これは同社が興味深いオプションとして発表したものであり、業界がより多くを理解するのに役立つはずです 機械学習 (機械学習)。
目新しさは、すでに同じ仕事をしている他の人工知能オプションに加わりますが、ブラウザ会社の進歩はより大きく、結果は本当に印象的です. 現在共有されている最初の詳細を確認してください。
機械学習 高度な
人工知能システムに基づいて、 Googleリサーチの研究部門 グーグルは、作成された最初の結果 (まだプロトタイプ段階) を提示しました。 画像。テキストを入力するときは、グラフィック参照を送信する必要がなく、ツールが画像を最初から作成するのを待つだけです。そのアイデアは、このツールが人工知能リソースを通じて、テキスト入力を基礎として使用するだけで高品質の写真を取得できるようにすることです。
(スクリーンショット: Victor Pacheco/Showmetech)
などの「競合他社」で実施されるテストでは、 DALL-E, VQ-GAN + CLIP e 潜在拡散モデル、または グーグル 指摘した 画像 少なくとも今のところ、より良い結果を出すことができたため、このツールは脚光を浴びています。 Google の AI 作業は、画像の作成から高解像度への適応まで、4 つのステップで行われます。
(写真:転載/Google)
テストは「オリンピックで泳ぐテディベア 400m バタフライ」などのランダムな単語で行われたため、結果は印象的です。 いくつかのテストはさらに進んでおり、開発者が Imagen を使用したテストを楽しんでいることがわかりました。さらに生成された画像を確認してください。
O グーグル は、近年人工知能ソリューションに最も多くの投資を行っている企業の XNUMX つです。 Google アシスタント 少しプレビューします。 パーソナル アシスタントは、スマートフォンの機能をアクティブまたは非アクティブにする単純なツール以上のものであり、一部のデバイスと同様に、自然なトーンで電話をかけることができます。 もはや言う必要はない 「OK Google」 会話を続ける アシスタントと。
の間に GoogleのI / O 2022、の名を冠したノベルティ Pathways 言語モデル (手のひら) は、テキストを使用して数学の問題を解決し、結果と情報がどのように得られたかの説明を提供することができました。
(写真:転載/Google)
同社は、 手のひら さまざまな分野で使用でき、機械学習を通じて、流暢ではない新しい言語を学習することもできます。
利用できる方 画像?
今のところ、の使用 グーグルのAI 結果がどのように使用されるかについて会社が懸念しているため、一般には公開されていません。 同社自身によると、画像を作成するためのデータは「キュレーションされていない Web スケール」から取得されたものであるため、テキストから画像への AI は、一部のマイノリティにとって不快な結果をもたらす可能性があるというリスクがあります。人々との写真を作成するように求められた場合。 公開された結果には人物の画像が含まれていないため、実際にこれがどのように発生するかはまだわかりません。
(写真:転載/Google)
同時に、 Googleリサーチ トレーニング フィルターは、ポルノ、人種差別的な侮辱、社会的ステレオタイプなどの不適切なノイズやコンテンツに対してフィルター処理されていることを指摘しています。 言い換えれば、人工知能トレーニングはインターネット上の情報に基づいて実施されたため、Google は 画像 不安やその他の問題を引き起こす画像を作成するために使用されます。
(写真:転載/Google)
AIの結果を発表した出版物で、Googleは競合他社にもメッセージを送り、人工知能をトレーニングして人と写真を作成する際に同じ注意を払うようにしました.
最初に公開された結果についてどう思いますか? 教えてください コメント!
また見なさい
新作の詳細はこちら Google I/O 2022 で紹介された Google プロダクト
Fontesは: Googleリサーチ l CNET l Googleブログ
Showmetech について詳しく知る
最新ニュースを電子メールで受け取るには登録してください。