本書詳細解讀了當前AI應用領域最具熱度、前景無限的AIGC內(nèi)容自動生成技術(shù),詳細介紹了AIGC的基本概念、價值、產(chǎn)生與發(fā)展的脈絡,以及實現(xiàn)AIGC所需的條件,重點解析了AIGC的核心技術(shù)(NLP、深度學習、大模型、硬件資源、大數(shù)據(jù)、訓練方法)。
五個維度講述
什么是AIGC / AIGC將會如何賦能創(chuàng)意產(chǎn)業(yè)
AIGC生態(tài)圈又是什么 / 如何看待AIGC帶來的變革
AIGC的現(xiàn)象級應用ChatGPT、Midjourney、voice.ai能做什么
2022年被稱為“AIGC元年”。AIGC(AI Generated Content)即人工智能生成內(nèi)容,是指通過機器學習、自然語言處理等技術(shù)來理解和生成文本、圖像、視頻、音頻等內(nèi)容的新型內(nèi)容生產(chǎn)方式。AIGC的技術(shù)發(fā)展速度驚人,迭代速度更是呈現(xiàn)指數(shù)級發(fā)展,這其中深度學習模型的不斷完善、開源模式的推動、大模型商業(yè)化的探索,都在助力AIGC的快速發(fā)展。超級聊天機器人——ChatGPT的出現(xiàn),拉開了智能創(chuàng)作時代的序幕。
隨著AIGC技術(shù)的不斷發(fā)展和應用,更多普惠的AI生產(chǎn)力平臺將以更低的門檻造福于有創(chuàng)造力和想象力的人群,人們可以更好地利用AIGC技術(shù)來提高工作效率、拓展信息獲取和娛樂方式、改善眾多行業(yè)領域的服務質(zhì)量、提高工作效率。
本書從AIGC的概念和核心技術(shù)出發(fā),系統(tǒng)介紹了AIGC的基本概念、價值、產(chǎn)生與發(fā)展的脈絡,以及實現(xiàn)AIGC所需的條件,重點解析了AIGC的核心技術(shù)——大模型、硬件資源及大數(shù)據(jù)和訓練方法。在AIGC的應用層面,重點介紹了ChatGPT這一現(xiàn)象級的AIGC應用,Midjourney——解放設計師的AI自動繪畫應用,以及voice.ai——提供1000種AI語音應用的使用場景以及無可限量的未來展望。AIGC 產(chǎn)業(yè)這部分內(nèi)容,介紹了AIGC為游戲、影視、廣告、元宇宙以及其他產(chǎn)業(yè)賦能的意義和面臨的挑戰(zhàn),以諸多鮮活的案例展示AIGC與這些產(chǎn)業(yè)的結(jié)合帶來的無限想象力。當然,AIGC這樣的“新物種”也面臨著機遇和挑戰(zhàn),本書在最后兩章中重點介紹了AIGC的生態(tài)圈以及在生產(chǎn)和生活等諸多方面“AIGC會帶給我們什么”的“冷思考”。本書集理論與實際相結(jié)合,特別突出了實踐和案例特色,能夠很好地滿足對AI技術(shù)感興趣的廣大讀者、AI技術(shù)愛好者、開發(fā)者、AIGC賽道的投資者的需求。
//一本書讀懂AIGC:探索AI商業(yè)化新時代全書共八章。第一章介紹了AIGC概念、價值、產(chǎn)生與發(fā)展的脈絡以及實現(xiàn)AIGC所需的條件,第二章介紹了AIGC的核心技術(shù),第三章介紹了AIGC現(xiàn)象級的應用——ChatGPT,第四章介紹了AIGC想象級應用——Midjourney,第五章介紹了AIGC另一個超級應用——能提供1000種AI語音的voice.ai。第六章介紹了AIGC 諸多產(chǎn)業(yè),全面賦能創(chuàng)意產(chǎn)業(yè),第七章介紹了AIGC上中下游生態(tài)圈,第八章思考AIGC會帶給我們什么。
在人工智能發(fā)展的漫長歷程中,如何讓機器學會創(chuàng)作,一直被視為難以逾越的天塹,“創(chuàng)造力”也因此被視為人類與機器最本質(zhì)的區(qū)別之一。然而,人類的創(chuàng)造力也終將賦予機器創(chuàng)造力,把世界送入智能創(chuàng)作的新時代。從機器學習到智能創(chuàng)造,從PGC、UGC到AIGC,我們即將見證一場深刻的生產(chǎn)力變革,而這種變革也會影響我們工作與生活的方方面面。
與此同時,我們也需要正視AIGC技術(shù)發(fā)展所帶來的一些風險和挑戰(zhàn),探索如何更好地利用AIGC技術(shù)服務社會、造福人類,推動AIGC技術(shù)的健康和可持續(xù)發(fā)展。
本書撰寫分工如下:薛達負責撰寫第一、二、三、四、五章,伏達負責撰寫第六章,應澤峰負責撰寫第七章,韋艷宜負責撰寫第八章。在本書寫作過程中,黃甜、永石等亦對本書的內(nèi)容做了貢獻。特別感謝機械工業(yè)出版社的王斌等為本書能夠順利出版而辛勤工作的編輯們,同時,也向所有幫助過我們的人致以最誠摯的謝意。
薛達
2023.10
薛達
美國杜克大學計算機專業(yè)畢業(yè),研究方向:計算機視覺、通用人工智能、數(shù)據(jù)科學,曾任職微軟亞太研究院STCA部門,參與研發(fā)的虛擬人肌肉綁定算法及材質(zhì)仿真相關(guān)算法成功應用于迪士尼、漫威、環(huán)球影業(yè)旗下多部電影(如《冰雪奇緣》)。帶領算法團隊自2013年起將深度學習技術(shù)應用于圖像增強、圖像檢測領域,帶領團隊與中國移動研究院合作打造數(shù)字長城、長城元宇宙平臺。
韋艷宜
芝士青年院ZSCBO創(chuàng)始人。在區(qū)塊鏈、元宇宙行業(yè)的品牌戰(zhàn)略領域資歷深厚,GBLS(全球無眠區(qū)塊鏈領袖峰會)的投資人和核心主創(chuàng)成員,曾任DAPP及GAME-FI準獨角獸——X-LAND METAVERSE的品牌顧問。
前言
第一章什么是AIGC/
1.1AIGC的概念——人工智能生成內(nèi)容/
1.2AIGC的價值——解放生產(chǎn)力/
1.2.1互聯(lián)網(wǎng)內(nèi)容生成方式的變革/
1.2.2提供更好的人機互動方式/
1.2.3為個人提供更好的學習資源/
1.2.4大幅降低成本、提升效率/
1.3AIGC的產(chǎn)生與發(fā)展/
1.3.1AIGC的前身:PGC和UGC/
1.3.2AIGC概念的提出/
1.3.3AIGC的興起/
1.4實現(xiàn)AIGC所需要的三個條件/
1.4.1海量的數(shù)據(jù)與模型:AI學習的基礎/
1.4.2強大的算力:AI學習的引擎/
1.4.3成熟高效的算法:AI學習的邏輯/
第二章AIGC的核心技術(shù)/
目錄//2.1NLP:AIGC的理論基礎/
2.2深度學習:用于生成高質(zhì)量內(nèi)容/
2.3大模型:AIGC的核心/
2.3.1GAN:生成對抗網(wǎng)絡/
2.3.2Diffusion Model:擴散模型/
2.3.3GPT-4:最新的大語言模型/
2.3.4CLIP:跨模態(tài)預訓練模型/
2.4硬件資源:AIGC的硬件基礎/
2.4.1GPU/
2.4.2內(nèi)存/
2.4.3存儲空間/
2.5大數(shù)據(jù):AIGC的原材料/
2.5.1數(shù)據(jù)采集與處理/
2.5.2數(shù)據(jù)存儲技術(shù)/
2.5.3數(shù)據(jù)處理技術(shù)/
2.5.4數(shù)據(jù)分析技術(shù)/
2.6訓練方法:AIGC的實現(xiàn)路徑/
2.6.1監(jiān)督訓練/
2.6.2半監(jiān)督訓練/
2.6.3無監(jiān)督訓練/
第三章ChatGPT——AIGC的現(xiàn)象級應用/
3.1ChatGPT:跨時代的聊天機器人/
3.1.1ChatGPT的背景/
//一本書讀懂AIGC:探索AI商業(yè)化新時代3.1.2ChatGPT的核心技術(shù)/
3.1.3ChatGPT的發(fā)展歷程/
3.1.4ChatGPT的主流應用/
3.2ChatGPT帶來的變革/
3.2.1對AI與人互動方式帶來的改變/
3.2.2對搜索引擎的沖擊/
3.2.3對教育領域的沖擊/
3.3ChatGPT的商業(yè)價值/
3.3.1提升企業(yè)數(shù)字化經(jīng)營能力/
3.3.2創(chuàng)造新的商業(yè)版圖/
3.4如何使用ChatGPT/
3.4.1ChatGPT的界面及交互方式/
3.4.2使用案例:基礎問答/
3.4.3使用案例:數(shù)據(jù)整理/
3.4.4使用案例:程序編寫與修改/
3.4.5使用案例:文章寫作/
第四章Midjourney——解放設計師的AI自動繪畫應用/
4.1Midjourney:AIGC想象級應用/
4.1.1Midjourney的核心技術(shù)/
4.1.2Midjourney的用途/
4.1.3Midjourney的特點/
4.2Midjourney的用戶/
4.2.1創(chuàng)意設計從業(yè)者/
4.2.2工業(yè)設計行業(yè)從業(yè)者/
4.2.3NFT從業(yè)者/
4.2.4個人愛好者/
4.3使用Midjourney實現(xiàn)創(chuàng)意/
4.3.1Midjourney的使用/
4.3.2自動生成繪畫作品/
4.3.3模仿不同藝術(shù)家的風格和技巧/
4.3.4Midjourney的指令和使用技巧/
4.4Midjourney未來展望/
4.4.1人工智能繪畫的前景/
4.4.2Midjourney的發(fā)展計劃/
第五章voice.ai ——提供海量的AI語音/
5.1voice.ai:生成任何你想要的聲音/
5.1.1voice.ai的用途/
5.1.2voice.ai的核心技術(shù)/
5.1.3voice.ai的特點/
5.2voice.ai的使用場景/
5.2.1游戲領域/
5.2.2影視領域/
5.2.3音樂領域/
5.2.4其他領域/
5.3使用voice.ai實現(xiàn)智能音頻/
5.3.1獲取賬戶及軟件/
5.3.2使用voice.ai實現(xiàn)AI音頻克隆/
第六章AIGC :全面賦能創(chuàng)意產(chǎn)業(yè)/
6.1AIGC 游戲/
6.1.1游戲行業(yè)簡述/
6.1.2游戲行業(yè)面臨的挑戰(zhàn):藝術(shù)創(chuàng)意成本高/
6.1.3AIGC賦能游戲行業(yè):降低設計與技術(shù)成本/
6.2AIGC 影視/
6.2.1影視行業(yè)簡述/
6.2.2影視動漫行業(yè)面臨的挑戰(zhàn):創(chuàng)意與美術(shù)的代價高/
6.2.3AIGC賦能影視動漫行業(yè):提供創(chuàng)意、降低美術(shù)
成本/
6.3AIGC 廣告/
6.3.1廣告行業(yè)簡述/
6.3.2廣告行業(yè)面臨的挑戰(zhàn):廣告創(chuàng)意難,實現(xiàn)成本高/
6.3.3AIGC賦能廣告行業(yè):提供無限創(chuàng)意與素材/
6.4AIGC 元宇宙/
6.4.1元宇宙行業(yè)簡述/
6.4.2元宇宙行業(yè)面臨的倫理和道德挑戰(zhàn):虛擬
行為和虛擬身份/
6.4.3AIGC賦能元宇宙/
6.4.4AIGC典型應用:制作虛擬人/
6.5AIGC 其他/
6.5.1AIGC 醫(yī)藥研發(fā)/
6.5.2AIGC 氣象科學/
6.5.3AIGC 礦業(yè)開發(fā)/
第七章AIGC生態(tài)圈——機遇產(chǎn)生之地/
7.1上游大廠:AIGC基礎設施的建設/
7.1.1大模型提供商/
7.1.2算力提供商/
7.1.3數(shù)據(jù)供給方/
7.1.4開源算法提供商/
7.1.5硬件設備廠商/
7.2中游“獨角獸”:垂直化/場景化的平臺建設/
7.2.1大模型的行業(yè)場景化針對性訓練/
7.2.2底層算法的垂直化二創(chuàng)及封裝/
7.2.3針對AIGC生產(chǎn)的海量數(shù)據(jù)的使用/
7.2.4典型代表:Photoshop的AI插件Alpaca/
7.3下游內(nèi)容服務商:內(nèi)容建設與分發(fā)/
7.3.1由UGC轉(zhuǎn)變?yōu)锳IGC為應用層平臺供給內(nèi)容源/
7.3.2由AIGC創(chuàng)造全新的互聯(lián)網(wǎng)、元宇宙應用層平臺/
7.3.3典型代表:視頻類平臺(Netflix)/
第八章冷思考——AIGC會帶給我們什么/
8.1AIGC會給人們的生產(chǎn)生活帶來怎樣的變化/
8.1.1社會生產(chǎn)新變化——為內(nèi)容創(chuàng)作領域帶來創(chuàng)新/
8.1.2對人們生活帶來的變化——內(nèi)容消費變革和職業(yè)發(fā)展
新方向/
8.2AIGC發(fā)展面臨哪些問題/
8.2.1AI技術(shù)存在的固有缺陷/
8.2.2生成作品在語義理解上的不完善/
8.2.3實現(xiàn)AIGC應用的的成本高昂/
8.2.4法律及市場監(jiān)管尚不完善/
8.3發(fā)展大勢不可逆的AIGC/
8.3.1AIGC的發(fā)展趨勢/
8.3.2我們應該如何應對AIGC帶來的變化/
參考文獻/