文章分享

OpenAI 發表文字生成影像模型「Sora」，快速創造逼真電影場景

2024年2月17日

Enterprise-ready solutions

文章分享

ChatGPT團隊OpenAI 16日凌晨發佈最新工具「Sora」，以日文「天空」命名，代表「沒有極限」。只要輸入簡短文字描述，就能生成一分鐘逼真影片，革命性的技術讓全世界掀起一波轟動。

OpenAI指出，Sora具有深入理解語言的能力，可以準確解釋用戶的提示，甚至還加碼豐富的背景細節、角色外型以及符合角色性格的細膩動作，好生成充滿情感的影片。此外，Sora還能在一支影片中創建多個鏡頭，將角色和視覺風格準確保留下來，也可以展現複雜場景，包括多個人物、特定類型的動作。

例如在示範影片中，用文字方式輸入，要 Sora 生成一個「美麗的東京雪景、相機隨街道移動、人們在飄雪和櫻花之下的小店街走路。」Sora在影片中呈現路面起伏累積的雨水，以及返照街道招牌的燈光等細節，甚至連人體走路時裙擺搖曳的畫面都自行加碼創建出來。

當然這創新的技術還是有一些待加強的事項。當環境特別複雜時，它可能就無法理解他的因果關係，像是蠟燭吹了以後就要熄滅，或是咬餅乾後，餅乾應該出現咬痕等情境。這些都是需要進一步調整和改進的地方。目前Sorar還未正式對外開放，僅提供給特定對象進行風險評估與測試。這樣可以確保在正式推出之前，能夠充分考慮各種可能的問題並加以修正。

在測試這項新工具的安全性的同時，也試著抓出裡面可能存在的種族、性別等的偏見問題。需要不斷地學習和改進，以確保技術能夠更好地滿足用戶的需求和期望。Sora生成的影片經過審查，想杜絕「極端暴力、性、仇恨圖像或名人肖像」的使用指令。

綜合而言，對於新工具的安全性測試是一個循序漸進的過程，不僅要關注技術層面的安全性，也需要注意到其中可能存在的價值觀和偏見問題。通過密切監控與改進，保證技術能夠更好地滿足用戶的需求和期望，同時也確保使用規則的合法性與合規性。

隨著人工智慧技術的不斷進步，我們正處於一個科技革新的時代，這不僅是對現有生活方式的挑戰，更是對未來的探索。

文章分享返回列表