FINWIRES · TerminalLIVE
FINWIRES

Nvidiaが視覚、音声、言語を組み合わせたマルチモーダルAIモデルを発表

作者

-- NVIDIA(NVDA)は火曜日、視覚、音声、言語機能を単一システムに統合したオープンなマルチモーダルAIモデル「Nemotron 3 Nano Omni」を発表した。 同社によると、このモデルはテキスト、画像、音声、動画を同時に処理できるため、個別のモデルを用意する必要がなくなり、文書認識、音声・動画推論、コンピュータ利用アプリケーションなどのタスクにおいて、より高い精度を実現するという。 NVIDIAは、このモデルは同等のモデルと比較して最大9倍の処理能力を発揮し、コスト削減と拡張性の向上を実現しながら、応答性も維持すると述べている。 NVIDIAによると、Nemotron 3 Nano OmniはFoxconnやPalantir(PLTR)などの企業に採用されており、Dell Technologies(DELL)やDocuSign(DOCU)などの企業もこの技術を評価しているという。

Price: $209.59, Change: $-7.02, Percent Change: -3.24%

相关文章