您的位置：首頁 > 新聞 > 單機資訊 > 新聞詳情

文字變視頻！OpenAI發(fā)布新AI模型Sora

時間：2024-02-16 10:58:05

來源：3DM編譯
作者：skylark
編輯：豆角

OpenAI去年憑借ChatGPT的流行而進入主流，現(xiàn)在該公司正將其人工智能技術(shù)應用到視頻行業(yè)。

OpenAI于周四推出了其新的生成式AI模型Sora。Sora的工作方式類似OpenAI的圖像生成AI工具DALL-E。用戶輸入所需場景，Sora將返回一個高清視頻片段。Sora還可以生成受靜態(tài)圖像啟發(fā)的視頻片段，或擴展現(xiàn)有視頻或填充缺失幀。

Sora是一個擴散式人工智能模型，與ChatGPT一樣，它使用谷歌研究人員在2017年論文中提出的Transformer架構(gòu)。OpenAI在其聲明中寫道：“Sora為能夠理解和模擬現(xiàn)實世界的模型奠定了基礎(chǔ)?！?

Sora目前只能生成一分鐘或更短的視頻。作為微軟支持的OpenAI，其發(fā)展目標之一是多模態(tài)——將文本、圖像和視頻生成結(jié)合起來，從而提供更廣闊的人工智能模型套件。

目前，Sora只提供給一小部分安全測試人員 (又稱“紅隊”) 使用，他們負責測試模型在錯誤信息和偏見等方面的漏洞。該公司表示，其配套的技術(shù)論文將在周四晚些時候發(fā)布。

OpenAI還表示，他們正在構(gòu)建一個可以識別由Sora生成的視頻的“檢測分類器”，并計劃在其輸出中包含某些元數(shù)據(jù)，以幫助識別人工智能生成的內(nèi)容。這與Meta在今年大選期間用來識別人工智能生成圖像的元數(shù)據(jù)類型相同。

現(xiàn)在聊天機器人和圖像生成器已經(jīng)進入消費和商業(yè)世界，視頻可能是生成式AI的下一個前沿。

借助Sora，OpenAI正在尋求與Meta和谷歌等公司的視頻生成AI工具競爭，后者于 1月宣布了Lumiere。其他初創(chuàng)公司也提供了類似的人工智能工具，例如Stability AI，其產(chǎn)品名為Stable Video Diffusion。亞馬遜還發(fā)布了Create with Alexa，這是一個專門生成基于提示的短格式動畫兒童內(nèi)容的模型。

OpenAI官網(wǎng)發(fā)布的Sora生成視頻：

Tokyo in the snow

視頻文字Prompt: “Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”

“美麗、白雪皚皚的東京城很繁華。鏡頭穿過熙熙攘攘的城市街道，跟隨幾個人享受美麗的雪天并在附近的攤位購物。美麗的櫻花花瓣隨著雪花在風中飛舞?！?

Gold Rush：加州淘金熱

Ships in coffee

文字變視頻！OpenAI發(fā)布新AI模型Sora