《Sora引领影像创作革命的力量》(简体)Kevin Chen【文字版_PDF电子书_雅书】

《Sora引领影像创作革命的力量》封面图片

内容简介:

2022年ChatGPT橫空問世,成為人工智慧的里程碑,而2024年一手打造ChatGPT的OpenAI又發布了文字生成影片大模型Sora,開創了視覺新紀元。只需要一行文字,Sora就能夠生成長達60秒的高精細影片,畫面不僅一鏡到底、多機位切換、完成複雜運鏡,還可呈現多變的人物及風景的動態,這意謂著使用者透過簡單的文字敘述,就能讓Sora創造出任何場景的影片,而打造出創新影片內容的無限可能性。

Sora是人工智慧領域的一次重大突破,更把多模態帶往新的發展階段。未來真正的通用人工智慧將會與人類相仿,可同時利用視覺、聽覺、觸覺等多種感知模態來理解世界,並對各種模態的資訊整合,而多模態突破的Sora加速推動了通用人工智慧的到來,拓展了人工智慧的應用領域。

Sora除了是一個文字生成影片大模型,還能理解使用者的需求在物理世界中的存在方式,其透過學習影片來理解真實世界的動態變化,並用電腦視覺技術模擬這些變化,從而創造出新的視覺內容。正如OpenAI在技術報告中所說的,Sora有望建構出能夠模擬物理世界的通用模擬器,也就是真實世界建模。

Sora的出世,也對各個產業產生巨大的影響及挑戰,像是在影音產業、廣告行銷、遊戲、醫療等多個領域上皆有巨大的應用和價值。而本書正是立基於此,內容深入淺出、循序漸進,以Sora為主題,介紹了Sora的誕生和爆發,以及Sora成功背後的技術路線,也對Sora帶來的產業變革進行細緻和深入的分析,可幫助讀者瞭解Sora,並在紛繁複雜的知識海洋中,梳理出認識人工智慧產業變革以及即將到來的通用人工智慧時代的線索。

作者简介:

Kevin Chen

知名科技作家,其英文專著曾被美國白宮總統圖書館、哈佛大學書店、耶魯大學圖書館、德國馬克思普朗克協會等國際頂尖機構收藏。多本著作以多種語言在全球發行,並被許多國家的重要圖書館收藏,包括美國、英國、加拿大、澳洲、法國、德國、日本等30多個國家和地區。

目  录:

|Chapter 01| Sora的前世今生

1.1 橫空降世的Sora

1.2 從ChatGPT到Sora

1.3 多模態的跨越式突破

|Chapter 02| Sora是如何煉成的?

2.1 Sora技術報告全解讀

2.2 用大模型的方法理解影片

2.3 Sora是世界模型嗎?

2.4 Sora背後的重磅團隊

|Chapter 03| 通用AI的里程碑

3.1 人類智慧vs人工智慧

3.2 從狹義AI到通用AI

3.3 Sora離通用AI還有多遠

3.4 奇異點隱現,未來已來

|Chapter 04| Sora爆發,顛覆了誰?

4.1 影視製作,一夜變天

4.2 Sora暴擊短影音產業

4.3 Sora如何改變廣告行銷

4.4 遊戲變革迎來Sora時刻

4.5 將視覺化帶入醫療

4.6 重塑設計產業

4.7 當Sora對上新聞業

4.8 下一個科學大爆發的時代

4.9 教育界的大浪淘沙

4.10 未來屬於擁抱技術的人

|Chapter 05| Sora的運算能力突圍

5.1 人類運算能力簡史

5.2 運算能力高地爭奪戰

5.3 Sora被困在運算能力裡

5.4 如何解決運算能力瓶頸和能耗問題

|Chapter 06| 大模型的未竟之路

6.1 大模型的胡言亂語

6.2 大模型深陷版權爭議

6.3 一場關於真實的博弈

6.4 價值對齊的憂慮

为您推荐