Sora掘金一本通:AI短視頻原理、提示詞到商業(yè)盈利
定 價(jià):78 元
- 作者:明機(jī) 編著
- 出版時(shí)間:2024/6/1
- ISBN:9787122453402
- 出 版 社:化學(xué)工業(yè)出版社
- 中圖法分類:TN948.4-39
- 頁(yè)碼:180
- 紙張:
- 版次:01
- 開(kāi)本:小16開(kāi)
如何快速了解Sora文生視頻這一強(qiáng)大模型,制作AI短視頻,搶占市場(chǎng)先機(jī),賺取第一桶金?
本書(shū)包括8章專題內(nèi)容布局+73個(gè)官方視頻示例分析+490多張圖片全程圖解,隨書(shū)還贈(zèng)送了8大資源:106分鐘同步教學(xué)視頻+111頁(yè)P(yáng)PT教學(xué)課件+112組AI視頻生成提示詞+119個(gè)效果文件+57集AI繪畫(huà)教學(xué)視頻+56集AI文案寫(xiě)作教學(xué)視頻+15000多組AI繪畫(huà)關(guān)鍵詞等。具體內(nèi)容從下面兩條線展開(kāi)。
一條是技能線:從AI短視頻的相關(guān)技術(shù)入手,介紹Sora的概念特點(diǎn)、基本能力、技術(shù)原理、模型架構(gòu)、生成式AI功能、指令編寫(xiě)、提示詞庫(kù)、商業(yè)變現(xiàn)等內(nèi)容,通過(guò)學(xué)習(xí)和實(shí)踐,讀者將能夠充分發(fā)揮Sora的強(qiáng)大功能,創(chuàng)作出令人驚嘆的短視頻作品,實(shí)現(xiàn)自己的創(chuàng)作和商業(yè)目標(biāo)。
一條是案例線:本書(shū)非常注重Sora的實(shí)際應(yīng)用,并通過(guò)大量的視頻案例分析,包括人像、風(fēng)光、動(dòng)物、植物、幻想、旅行等多種題材,同時(shí)涉及動(dòng)畫(huà)短片、電影預(yù)告片、無(wú)人機(jī)航拍視頻、歷史鏡頭視頻、電商廣告視頻、游戲視頻等多個(gè)領(lǐng)域,全方位展示了Sora在不同場(chǎng)景下的應(yīng)用效果。
本書(shū)是一本不可多得的AI短視頻生成技術(shù)指南,適合短視頻創(chuàng)作者、影視制作人員、攝影師、市場(chǎng)營(yíng)銷人員、AI技術(shù)愛(ài)好者與開(kāi)發(fā)者、教育工作者及研究人員等廣大群體閱讀。此外,本書(shū)還可以作為相關(guān)培訓(xùn)機(jī)構(gòu)和職業(yè)院校的參考教材。
明機(jī)
·AI訓(xùn)練師:對(duì)人工智能三要素算法、算力、算據(jù)(數(shù)據(jù))擁有深厚的研究,熟悉AI算法和模型特性,擅長(zhǎng)使用TensorFlow、PyTorch等框架技術(shù)進(jìn)行模型訓(xùn)練與產(chǎn)品開(kāi)發(fā);
·AI工程師:對(duì)Sora生成連貫視頻序列的循環(huán)神經(jīng)網(wǎng)絡(luò),Sora處理復(fù)雜視覺(jué)內(nèi)容的空間時(shí)間補(bǔ)丁,Sora加快視頻生成速度的自回歸變壓器等技術(shù),Sora成為世界模擬器等技術(shù)掌握頗深;
·AI先行者:AI提示詞庫(kù)創(chuàng)作者,首批應(yīng)用ChatGPT、gemini、Stable Diffusion 、Midjourney、DALLoE、Firefly、Sora、Pika、Runway等AI工具的從業(yè)人員,擅長(zhǎng)AI文案編寫(xiě)、AI繪畫(huà)與AI視頻生成訓(xùn)練。
第1章 認(rèn)識(shí)Sora:強(qiáng)大的人工智能視頻生成模型 1
1.1 Sora是什么 2
1.1.1 Sora的基本介紹 2
【示例1】:走在東京街頭的時(shí)尚女性 3
1.1.2 Sora的功能特點(diǎn) 4
【示例2】:穿過(guò)東京郊區(qū)的火車窗外的倒影 4
1.1.3 Sora的競(jìng)品對(duì)比 6
【示例3】:坐在天空中的一片云上看書(shū)的年輕人 7
1.1.4 Sora的核心優(yōu)勢(shì) 9
1.1.5 Sora的創(chuàng)意用途 10
【示例4】:培養(yǎng)皿里的竹林和奔跑的熊貓 11
1.2 面對(duì)Sora,我們?cè)撍伎嫉?個(gè)問(wèn)題 12
1.2.1 文生視頻模型為什么會(huì)火 12
【示例5】:在日落時(shí)分愜意地漫步 16
1.2.2 Sora的發(fā)布意味著什么 17
【示例6】:手機(jī)鏡頭下的未來(lái)城市風(fēng)貌 18
1.2.3 我們與Sora有何關(guān)系 19
【示例7】:“云人閃電”的科幻電影片段 20
1.2.4 我們?cè)撊绾螒?yīng)對(duì)Sora 21
1.2.5 普通人該怎么入局 23
【示例8】:冬日長(zhǎng)毛猛犸象的壯麗景色 24
第2章 能力解析:Sora如何高效地生成視頻 26
2.1 Sora的技術(shù)創(chuàng)新點(diǎn) 27
2.1.1 支持多樣化視頻格式 27
【示例9】:在大海中游動(dòng)的海龜 27
2.1.2 改進(jìn)的畫(huà)面構(gòu)圖和框架 29
【示例10】:兔子和松鼠的奇妙混合物 30
2.1.3 語(yǔ)言理解與視頻生成 31
【示例11】:不同的人物在不同的城市散步 33
2.1.4 多模態(tài)輸入處理 34
【示例12】:無(wú)人機(jī)環(huán)繞拍攝的海邊建筑 35
2.1.5 可變的持續(xù)時(shí)間、分辨率、寬高比 36
【示例13】:白發(fā)男人的特寫(xiě)鏡頭 37
2.2 Sora強(qiáng)大的視頻生成能力 37
2.2.1 3D一致性:以3D的視角呈現(xiàn)物體和人物的運(yùn)動(dòng) 37
【示例14】:推鏡頭展示熙熙攘攘的東京城市街道 38
【示例15】:搖鏡頭展示令人驚嘆的山水風(fēng)光 39
2.2.2 長(zhǎng)期一致性:保持視頻中的人物和場(chǎng)景的不變 40
【示例16】:一只達(dá)爾馬提亞狗從窗戶向外看 41
2.2.3 世界交互模擬:模擬人物與環(huán)境之間簡(jiǎn)單的互動(dòng) 42
【示例17】:模擬畫(huà)家的創(chuàng)作過(guò)程 42
【示例18】:模擬人物吃漢堡的場(chǎng)景 42
2.2.4 模擬數(shù)字世界:探索與創(chuàng)造的無(wú)界數(shù)字世界 43
【示例19】:模擬《我的世界》游戲場(chǎng)景 43
2.2.5 復(fù)雜元素生成能力:打造出逼真的虛擬場(chǎng)景 44
【示例20】:一大堆老式電視播放著不同的節(jié)目 44
【示例21】:逼真的動(dòng)畫(huà)特寫(xiě)場(chǎng)景 46
2.2.6 多鏡頭生成能力:呈現(xiàn)出豐富的視覺(jué)盛宴 46
【示例22】:用不同的鏡頭展示的機(jī)器人 47
2.3 Sora面臨的一些局限性和挑戰(zhàn) 48
2.3.1 模擬物理世界的局限性 48
【示例23】:破碎的玻璃杯 49
2.3.2 生成長(zhǎng)視頻的難度 50
【示例24】:在沙漠中發(fā)現(xiàn)的塑料椅子 50
【示例25】:籃球通過(guò)籃筐后爆炸 51
2.3.3 理解復(fù)雜提示詞的準(zhǔn)確性 52
【示例26】:慶祝生日的溫馨家庭場(chǎng)景 53
2.3.4 訓(xùn)練模型的復(fù)雜性 54
【示例27】:35毫米電影風(fēng)格的跑步動(dòng)作場(chǎng)景 55
2.3.5 提升視頻生成的時(shí)效性 56
【示例28】:偏僻路上小狼嬉戲的場(chǎng)景 57
第3章 技術(shù)原理:解析Sora的技術(shù)特性與優(yōu)勢(shì) 59
3.1 解析Sora的技術(shù)原理 60
3.1.1 Sora如何根據(jù)文本生成內(nèi)容——Diffusion模型 60
3.1.2 Sora如何處理復(fù)雜視覺(jué)內(nèi)容——時(shí)間空間補(bǔ)丁 62
3.1.3 Sora如何生成連貫的視頻序列——循環(huán)神經(jīng)網(wǎng)絡(luò) 63
【示例29】:中國(guó)農(nóng)歷新年慶祝視頻 64
3.1.4 Sora如何生成不同風(fēng)格的視頻——生成對(duì)抗網(wǎng)絡(luò) 65
3.1.5 Sora如何加快視頻的生成速度——自回歸變換器 67
3.2 Sora在視頻生成過(guò)程中的3個(gè)關(guān)鍵步驟 68
3.2.1 步驟1:視頻壓縮網(wǎng)絡(luò) 68
【示例30】:一窩金毛尋回犬在雪地里玩耍 68
3.2.2 步驟2:時(shí)間空間潛在補(bǔ)丁提取 69
3.2.3 步驟3:視頻生成的Transformer模型 70
【示例31】:淘金熱期間加利福尼亞州的歷史錄像 70
3.3 Sora技術(shù)的未來(lái)展望 71
3.3.1 技術(shù)革新與性能升級(jí):速度更快、穩(wěn)定性更強(qiáng)、體驗(yàn)更流暢 71
3.3.2 跨領(lǐng)域融合與拓展應(yīng)用:讓生活更加多姿多彩、充滿無(wú)限可能 72
第4章 模型架構(gòu):Sora的基礎(chǔ)是世界通用模型 73
4.1 認(rèn)識(shí)世界通用模型 74
4.1.1 什么是世界通用模型 74
4.1.2 世界通用模型的作用是什么 75
【示例32】:Santorini的航拍建筑美景 76
4.1.3 多模態(tài)模型促進(jìn)AI更好地理解真實(shí)世界 77
【示例33】:一列蒸汽火車行駛在高架橋上 78
4.1.4 世界通用模型打破了虛擬與現(xiàn)實(shí)的邊界 79
【示例34】:愜意漫步的南非婦女 79
4.1.5 世界通用模型的代表——Runway 80
4.2 Sora將視頻生成模型作為世界模擬器 81
4.2.1 用大語(yǔ)言模型的方法理解視頻 81
【示例35】:一群紙飛機(jī)在茂密的叢林中飛舞 82
【示例36】:愉快漫步的老人 83
【示例37】:白雪皚皚的東京城 84
4.2.2 實(shí)現(xiàn)對(duì)物理世界的“涌現(xiàn)” 85
【示例38】:可愛(ài)的達(dá)爾馬提亞狗 85
4.2.3 模擬真實(shí)物理世界的運(yùn)動(dòng) 87
【示例39】:壯觀的海岸風(fēng)光 88
4.3 Sora模型訓(xùn)練的核心技術(shù) 90
4.3.1 自然語(yǔ)言理解 90
4.3.2 生成式人工智能模型 92
【示例40】:老年人的悠閑生活與美麗的自然風(fēng)光 93
4.3.3 場(chǎng)景構(gòu)建與精細(xì)化渲染 96
4.3.4 AI驅(qū)動(dòng)的動(dòng)畫(huà)技術(shù) 98
【示例41】:眨眼的特寫(xiě)鏡頭 99
4.3.5 個(gè)性化定制與持續(xù)優(yōu)化 100
【示例42】:不同風(fēng)格的袋鼠漫步場(chǎng)景 101
第5章 功能詳解:使用Sora快速生成視頻 105
5.1 Sora的文生視頻功能 106
5.1.1 Sora的注冊(cè)方法 106
5.1.2 申請(qǐng)Sora的內(nèi)測(cè)資格 110
5.1.3 使用文生視頻功能 113
5.2 Sora的其他AI生成功能 114
5.2.1 圖生視頻:為DALL·E圖像制作動(dòng)畫(huà) 114
【示例43】:活潑可愛(ài)的柴犬 115
【示例44】:一個(gè)多樣化的怪物家族 116
【示例45】:由字母組成的云朵圖片 117
【示例46】:沖浪者在歷史大廳中駕馭巨浪 118
5.2.2 視頻生視頻:向前或向后擴(kuò)展視頻的時(shí)長(zhǎng) 119
【示例47】:舊金山的高空城市纜車 119
【示例48】:永無(wú)止境的騎行場(chǎng)景 122
5.2.3 視頻到視頻編輯:轉(zhuǎn)換視頻的風(fēng)格和環(huán)境 123
【示例49】:飛馳在叢林中的跑車 123
5.2.4 連接視頻功能:創(chuàng)建神奇的無(wú)縫過(guò)渡效果 125
【示例50】:無(wú)人機(jī)視頻與蝴蝶視頻的連接 126
【示例51】:越野車視頻與豹子視頻的連接 128
5.2.5 圖像生成功能:為用戶帶來(lái)卓越的體驗(yàn) 130
第6章 指令編寫(xiě):優(yōu)化提示詞提升Sora的生成效果 133
6.1 編寫(xiě)Sora提示詞的基礎(chǔ)思路 134
6.1.1 明確具體的視頻元素 134
【示例52】:一只在拍攝視頻的柯基犬 134
6.1.2 詳細(xì)描述場(chǎng)景細(xì)節(jié) 135
【示例53】:一朵花生長(zhǎng)的定格動(dòng)畫(huà) 135
6.1.3 創(chuàng)造性地使用提示詞 136
【示例54】:一群魚(yú)在紐約的街道上游動(dòng) 136
6.1.4 構(gòu)思引人入勝的角色和情節(jié) 137
【示例55】:一只貓叫醒正在睡覺(jué)的主人 137
6.1.5 用逐步引導(dǎo)的方式構(gòu)建提示詞 139
【示例56】:擠滿了工人的建筑工地 139
6.2 Sora提示詞的編寫(xiě)技巧 140
6.2.1 如何選擇Sora的提示詞 140
【示例57】:基納巴丹干河上的野生動(dòng)物 141
6.2.2 Sora提示詞的編寫(xiě)順序 142
【示例58】:美術(shù)館內(nèi)的藝術(shù)盛宴 143
6.2.3 編寫(xiě)Sora提示詞的注意事項(xiàng) 143
【示例59】:跳迪斯科舞的卡通袋鼠 144
第7章 提示詞庫(kù):打造專業(yè)級(jí)視頻效果必備的要素 145
7.1 Sora內(nèi)容型提示詞 146
7.1.1 主體特征 146
【示例60】:在南極洲愉快漫步的女人 147
【示例61】:不同主體特征的視頻效果 148
7.1.2 場(chǎng)景特征 150
【示例62】:色彩斑斕的魚(yú)類和海洋生物 151
7.1.3 藝術(shù)風(fēng)格 152
【示例63】:太空冒險(xiǎn)故事的電影預(yù)告片 153
7.2 Sora標(biāo)準(zhǔn)化提示詞 155
7.2.1 畫(huà)面構(gòu)圖 155
【示例64】:變色龍的特寫(xiě)鏡頭 156
7.2.2 視線角度 157
【示例65】:維多利亞冠鴿的側(cè)面視角 158
7.2.3 畫(huà)面景別 159
【示例66】:玻璃球體里的小矮人 160
7.2.4 色彩色調(diào) 161
【示例67】:在茂密的花園里奔跑的虎斑貓 162
7.2.5 環(huán)境光線 163
【示例68】:月光下的狼嚎剪影動(dòng)畫(huà) 164
【示例69】:在霓虹燈城市中嬉戲的小狗 165
7.2.6 鏡頭參數(shù) 165
【示例70】:深海中的大章魚(yú)和帝王蟹之戰(zhàn) 166
第8章 商業(yè)變現(xiàn):從文本到視頻的創(chuàng)收之路 168
8.1 Sora未來(lái)可能的商業(yè)場(chǎng)景應(yīng)用 169
8.1.1 電商產(chǎn)品展示 169
8.1.2 視頻廣告制作 170
8.1.3 游戲開(kāi)發(fā)和動(dòng)畫(huà)片制作 170
【示例71】:展示游戲《我的世界》 171
【示例72】:水獺的熱帶沖浪冒險(xiǎn) 172
8.1.4 電影電視節(jié)目制作 173
【示例73】:海盜船激戰(zhàn)瞬間 173
8.1.5 教育內(nèi)容制作 174
8.2 如何利用Sora實(shí)現(xiàn)多渠道變現(xiàn) 174
8.2.1 廣告收入與贊助變現(xiàn) 175
8.2.2 知識(shí)付費(fèi)變現(xiàn) 175
8.2.3 提示詞交易變現(xiàn) 176
8.2.4 內(nèi)容創(chuàng)作變現(xiàn) 177
8.2.5 Sora的其他變現(xiàn)方式 178