【亜州ビジネス編集部】
中国の電子商取引(EC)最大手、阿里巴巴集団HD(アリババ・グループ・ホールディング)傘下の阿里雲(アリババクラウド)は1月28日、新たなオープンソースのビジュアル理解モデル「Qwen2.5-VL」を正式にリリースし、このモデルは最近話題の「DeepSeek-V3」を上回るものと自信を示した。央広網などが同日付で報じた。
新モデルは3つのバージョン(3B、7B、72B)を用意。なかでもフラッグシップモデル「Qwen2.5-VL-72B」は卓越した性能を誇り、13項目からなる権威ある評価基準において、ビジュアル理解分野の最高栄誉を獲得した。これは前述の「DeepSeek-V3」だけでなく、競合するオープンAIの「GPT-4o」やアンソロピックの「Claude3.5」を圧倒的に凌駕しているという。
この前例のないビジュアルモデルは、画像コンテンツの解析能力が優れているだけでなく、1時間を超える動画の理解を革新的にサポートする。煩雑な設定を必要とせず、スマートフォンやパソコンを制御できるAIビジュアルエージェントに変身。挨拶の送信、パソコンでの写真のレタッチ、スマホでのチケット予約など、複数ステップにわたる複雑なタスクを簡単に完了できる。デジタルライフに新たな可能性を開くものだ。
一方、「DeepSeek」は中国のスタートアップ企業、杭州深度求索人工智能基礎技術研究有限公司が開発した高性能の大規模言語モデル(LLM)。米スケールAIを運営するアレクサンドル・ワン最高経営責任者(CEO)は先ごろ、2024年12月にオープンソースLLM「DeepSeek-V3(パラメータ数:6710億)」、今月20日に推論モデル「DeepSeek-R1」が相次ぎリリースされたことで、米国主導だったAI開発の構図が大きく変わりつつあるとの見解を示している。後者の「R1」は、オープンAIが先ごろ発表した推論モデル「o1」の性能に匹敵しているという。
中国現地メディアによると、杭州深度求索は23年7月に「80後(1980年代生まれ)」の梁文鋒氏によって設立された新興AI企業。浙江大学で電子工学を専攻した梁氏がクオンツファンド「幻方量化」の創業で財産を築いた後に立ち上げた。梁氏は20年頃からスーパーコンピューターの構築に乗り出し、21年時点で「A100」(H100の旧モデル)1万台規模を擁していたとされる。 昨年末にリリースされた「DeepSeek-V3」は、開発予算がわずか557万米ドルにすぎず、「H800」(H100の中国向け低グレード版)2048台を使って55日で完成した。API料金が米国のサービスより大幅に安く設定されている上、公式サイトによると、同モデルの性能は、メタの「Llama 3.1(パラメータ数:4050億)」やオープンAIの「GPT-4o」、アンソロピックの「Claude 3.5-Sonnet」などに匹敵するという。