易信資訊

OpenAI 發表文字生成影像模型「Sora」,快速創造逼真電影場景

ChatGPT團隊OpenAI 16日凌晨發佈最新工具「Sora」,以日文「天空」命名,代表「沒有極限」。只要輸入簡短文字描述,就能生成一分鐘逼真影片,革命性的技術讓全世界掀起一波轟動。

OpenAI指出,Sora具有深入理解語言的能力,可以準確解釋用戶的提示,甚至還加碼豐富的背景細節、角色外型以及符合角色性格的細膩動作,好生成充滿情感的影片。此外,Sora還能在一支影片中創建多個鏡頭,將角色和視覺風格準確保留下來,也可以展現複雜場景,包括多個人物、特定類型的動作。

例如在示範影片中,用文字方式輸入,要 Sora 生成一個「美麗的東京雪景、相機隨街道移動、人們在飄雪和櫻花之下的小店街走路。」Sora在影片中呈現路面起伏累積的雨水,以及返照街道招牌的燈光等細節,甚至連人體走路時裙擺搖曳的畫面都自行加碼創建出來。

當然這創新的技術還是有一些待加強的事項。當環境特別複雜時,它可能就無法理解他的因果關係,像是蠟燭吹了以後就要熄滅,或是咬餅乾後,餅乾應該出現咬痕等情境。這些都是需要進一步調整和改進的地方。目前Sorar還未正式對外開放,僅提供給特定對象進行風險評估與測試。這樣可以確保在正式推出之前,能夠充分考慮各種可能的問題並加以修正。

在測試這項新工具的安全性的同時,也試著抓出裡面可能存在的種族、性別等的偏見問題。需要不斷地學習和改進,以確保技術能夠更好地滿足用戶的需求和期望。Sora生成的影片經過審查,想杜絕「極端暴力、性、仇恨圖像或名人肖像」的使用指令。

綜合而言,對於新工具的安全性測試是一個循序漸進的過程,不僅要關注技術層面的安全性,也需要注意到其中可能存在的價值觀和偏見問題。通過密切監控與改進,保證技術能夠更好地滿足用戶的需求和期望,同時也確保使用規則的合法性與合規性。

隨著人工智慧技術的不斷進步,我們正處於一個科技革新的時代,這不僅是對現有生活方式的挑戰,更是對未來的探索。

Scroll to Top