中國(guó)の國(guó)産基盤(pán)モデルにより、兵馬俑でもダンス?
ソース:人民網(wǎng)日本語(yǔ)版作者: 2024-01-15 15:40
兵馬俑、イーロン?マスク氏、そして各地のネットユーザーによる「科目三」ダンスやネット有名人によるダンスなどの動(dòng)畫(huà)がこのところ、中國(guó)のSNSで流行している。これらの10秒ほどの動(dòng)畫(huà)に生身の人間は出演せず、いずれも基盤(pán)モデルで生成されたものだ。多くのネットユーザーがこのハードルの低い「ダンス」を體験するようになり、ダンスを競(jìng)うブームが巻き起こった。中央テレビ網(wǎng)が伝えた。
これは阿里雲(yún)(アリクラウド)の「通義千問(wèn)」アプリがリリースした無(wú)料の機(jī)能で、アプリ內(nèi)で「通義舞王」「全民舞王」などの言葉を入力すると體験ページに入ることができる。ユーザーが表示に従い畫(huà)像をアップロードすると、指定したダンスのような動(dòng)きで踴る動(dòng)畫(huà)が十?dāng)?shù)分で生成され、元の畫(huà)像の表情や體形、ファッション、そして背景などの特徴はそのまま動(dòng)畫(huà)に反映される?!竿x千問(wèn)」は第1弾としてユーザーに「科目三」「モンゴルダンス」「パドルステップ」「メルボルンシャッフル」などの12種の人気ダンステンプレートを提供している。
この機(jī)能を支えるアルゴリズムは、阿里通義実験室が開(kāi)発した動(dòng)畫(huà)生成モデル「Animate Anyone」だ。この研究は早くも昨年11月末の時(shí)點(diǎn)でX(舊ツイッター)やユーチューブなどの海外SNSで人気になり、関連する動(dòng)畫(huà)の再生數(shù)が1億回以上、開(kāi)発者のためのコミュニティであるGithubのスター數(shù)はわずか數(shù)日で1萬(wàn)を超え、最近の基盤(pán)モデル分野で最も人気の基盤(pán)モデルアルゴリズムの一つとなった。海外の開(kāi)発者とネットユーザーはこのアルゴリズムの効果を稱賛し、「體験の入口を開(kāi)放してほしい」と呼び掛けた。
公開(kāi)された論文によると、Animate Anyoneは複數(shù)のイノベーション技術(shù)を集積し、ReferenceNetを?qū)毪贰⒃萎?huà)像の情報(bào)を捕捉?保存し、人物、表情、ファッションの細(xì)部を高度に再現(xiàn)できる。また同アルゴリズムは高効率の姿勢(shì)ガイド「Pose Guider」を利用し、動(dòng)きの精度と制御性を保証。さらに順序生成モジュールにより、動(dòng)畫(huà)のフレーム間の滑らかさを効果的に保証した。同じデータセットを使ったテストでは、Animate Anyoneの性能は中國(guó)內(nèi)外の同類(lèi)モデルを大きく上回った。
編集:董麗娜
文章と寫(xiě)真の著作権は元の作者に屬します。侵害があれば、削除に連絡(luò)してください。