Google CloudがNVIDIA L4 GPUインスタンスを利用可能にする初のCSPに
NVIDIAはGoogle Cloudが新しいL4 GPUとVertex AIを統合し、急速に拡大するジェネレーティブAIアプリケーションを構築する企業の作業を加速させることを発表した。Google Cloudは、本日よりプライベートプレビューで利用できるようになったことを発表したG2仮想マシンによって、顧客にNVIDIA L4 TensorコアGPUを提供する最初のクラウドサービスプロバイダとなる。さらに、大規模な生成AIモデルの構築、チューニング、デプロイをサポートするVertex AIで、L4 GPUが最適化されたサポートで利用可能となる。
開発者は最新の先端技術にアクセスし、新しいアプリケーションを迅速かつコスト効率よく立ち上げて実行できるようになる。L4 GPUはほぼすべてのワークロードに対応するユニバーサルGPUであり、CPUの120倍のAI性能をビデオパフォーマンスで発揮できる強化されたAIビデオ機能と、99%優れたエネルギー効率を兼ね備えている。
ジェネレーティブ AI への関心の高まりを受けて、企業はビジネスモデルをサポートするためにクラウドベースのコンピューティングに目を向けている。NVIDIAはGoogle Cloudと協力して、このような企業が必要とする機能を簡単に利用できるようにし、新しく作成されるすばらしいツールやアプリケーションをサポートできるようにします。
NVIDIA創業者 / CEO ジェンスン フアン
ジェネレーティブAIはコンピューティングの新時代の象徴であり、この時代にはGoogle Cloudで提供されるスピード、スケーラビリティ、信頼性が求められます。当社の顧客が Gen AI の可能性を探求し始める中、ワークロードに最適化された Compute Engine ポートフォリオの一部として、NVIDIA の最新の L4 GPUイノベーションを顧客に提供できることを誇りに思います。
Google Cloudシステムおよびサービスインフラストラクチャ担当バイスプレジデント アミン・ヴァーダット
新しいジェネレーティブAIアプリケーションの実現を支援
Google CloudはジェネレーティブAIアプリケーションを構築するさまざまな組織にインフラストラクチャを提供しているが、その多くは専門家が仕事をより良く、より速く行うのに役立つように設計されている。アプリケーションの運用を成功させるには迅速な推論が重要であり、ジェネレーティブAIは人々がつながり、楽しむのに役立つ多くの新しいアプリも推進している。Dreamと呼ばれるAIを活用したテキストからデジタルアートへの変換アプリを提供するWOMBOは、Google Cloud上のNVIDIAのL4推論プラットフォームに早期アクセスした。WOMBOは最新のAIテクノロジを利用して、人々がユーザーのプロンプトから没入型のデジタルアートワークを作成し、アイデアだけであらゆるスタイルの高品質でリアルなアートを作成できるようになる。とWOMBOのCEOであるベン・ジオン・ベンヒンは語る。NVIDIAのL4推論プラットフォームにより、独自のアートワークを作成して共有しようとするユーザーに、より優れた効率的な画像生成エクスペリエンスを提供できるようになる。
DescriptはAIを活用した編集機能を提供し、クリエーターは数クリックでフィラーワードを削除したり、キャプションを追加したり、ソーシャルメディアクリップを作成したりすることができる。あるいはDescriptのジェネレーティブAI音声クローンを使用して、キーボード入力するだけで音声の間違いを修正したり、ナレーションを一から作成したりすることもできる。DescriptはNVIDIA TensorRTを使用してモデルを最適化し、AI推論を加速し、これにより、ユーザーはビデオの背景を置き換え、音声を強化してスタジオなしでスタジオ品質のコンテンツを作成することが可能となる。
提供予定と詳細情報
NVIDIA L4 GPUはGoogle Cloudのプライベート プレビューで利用することができる。アクセス申請はこちら。また、GTCの基調講演でNVIDIAのジェネレーティブAI向けの推論プラットフォームがGoogle Cloudに統合されたことをフアンが紹介している。
NVIDIA
1993年の設立以来、NVIDIAはアクセラレーテッドコンピューティングのパイオニアであり、同社が1999年に発明したGPUは、PCゲーム市場の成長を促進し、コンピューターグラフィックスを再定義して、現代のAIの時代に火をつけながら、メタバースの創造を後押ししている。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタックコンピューティング企業。