一個萬物互聯(lián)的數(shù)字化世界正在悄然形成,不知不覺中,我們已經(jīng)進入到了一個前所未有的數(shù)字化與智能化時代。
數(shù)智化時代對人類社會的改變是顛覆性的。半導體芯片技術(shù)的突飛猛進,使得萬物皆可“數(shù)”;寬帶泛在網(wǎng)絡的普及應用,使得萬物皆可“連”;云計算(算力)與人工智能(算法)的并行發(fā)展,使得萬事皆可“算”。數(shù)據(jù)已成為新的生產(chǎn)要素,算法和算力已成為新的生產(chǎn)動力,機器智能將成為新的生產(chǎn)工具,數(shù)字經(jīng)濟、數(shù)字社會、數(shù)字生活和數(shù)字治理都將成為智能革命廣闊的主戰(zhàn)場。我們該如何認識并適應這個時刻變化中的世界?
《圖解數(shù)據(jù)智能》是一本為數(shù)字資源的對接方、分配方以及廣大的入門學習者提供相關數(shù)據(jù)智能概念的科普讀物。書中各個概念之間相對獨立,讀者可以將其作為一本檢索用的工具書籍,也可以根據(jù)自己的興趣靈活查閱相關篇章。
無論你是數(shù)智化領域的專業(yè)從業(yè)人員,還是剛剛畢業(yè)想要進入該領域的技術(shù)小白,抑或是正面臨著數(shù)字化轉(zhuǎn)型的政府或企業(yè)人員,或者是千千萬萬個生活在這個數(shù)智化社會中的普通人,都可以閱讀此書,你將從酣暢淋漓的技術(shù)釋疑和輕松有趣的漫畫解讀中,找到自己的答案。
這是一本人人都能讀懂、趣味十足的技術(shù)科普書。
近百個核心技術(shù)概念,為你深度解讀數(shù)據(jù)智能時代背后的邏輯。
酣暢淋漓的技術(shù)釋義,輕松有趣的漫畫解讀,帶你輕松認知這個時刻變化中的世界
1、通俗易懂
生動鮮活的生活示例+幽默風趣的行文插畫,對數(shù)據(jù)智能領域的核心概念進行演繹呈現(xiàn)。
2、技術(shù)科普
近百個數(shù)據(jù)智能概念,高頻、熱門、有用,助你快速掃除對數(shù)據(jù)智能時代的認知障礙。
3、貼近時代、貼近應用
所有技術(shù)概念均來自當前數(shù)字化生活中你每天能聽到/看到/刷到/聊到的詞匯,掌握這些概念,便能輕松暢游數(shù)據(jù)智能世界。
本書適合——
想進入數(shù)據(jù)智能領域的技術(shù)小白
面臨數(shù)字化轉(zhuǎn)型的政府及企業(yè)人員
技術(shù)功底薄弱的產(chǎn)品經(jīng)理/市場營銷人員/……
千千萬萬個處于數(shù)智化時代中的普通人
幾十年前的我們可能無法相信,我們生活在一個多么令人難以置信的時代;ヂ(lián)網(wǎng)的飛速發(fā)展讓我們以光速躍進了信息時代,信息大爆炸又讓我們跌入了大數(shù)據(jù)時代,緊接著大數(shù)據(jù)等新一代信息技術(shù)的進一步發(fā)展和應用讓人工智能時代迎面撞來。曾經(jīng)的我們還處在人類棋手被人工智能擊敗的錯愕之中,短短幾年,我們的生活場景就逐漸被人工智能這個新物種占據(jù)。
2021 年10 月28 日,F(xiàn)acebook 宣布將更名為Meta,從此轉(zhuǎn)向以虛擬現(xiàn)實為主的新興計算平臺。公司CEO 扎克伯格表示,F(xiàn)acebook 數(shù)年內(nèi)將從“一家社交媒體公司變成一家元宇宙公司”。
一石激起千層浪。業(yè)界在驚呼:“元宇宙”真的要來了嗎?盡管學術(shù)界和工業(yè)界半信半疑,但似乎也沒有鮮明的反對聲音。人類社會發(fā)展到今天,人們已經(jīng)開始習慣了科技大佬們的“未卜先知”。今天,我們就奔跑在《未來之路》(比爾·蓋茨,1995)所描繪的信息高速公路上,我們就沉浸在《數(shù)字化生存》(尼古拉·尼葛洛龐帝,1996)所預言的數(shù)字化虛擬空間中。本以為是游戲世界中的場景,沒想到有可能真的要照進人類社會的現(xiàn)實中。
一個萬物互聯(lián)的數(shù)字化世界正在悄然形成,不知不覺中,我們已經(jīng)進入了一個前所未有的數(shù)字化與智能化時代了。
與以往的任何時代都迥然不同,今天的數(shù)智化時代對人類社會的改變將是顛覆性的。我們得益于半導體芯片技術(shù)的突飛猛進,使得萬物皆可“數(shù)”;我們得益于寬帶泛在網(wǎng)絡的普及應用,使得萬物皆可“連”;我們得益于云計算(算力)與人工智能(算法)的并行發(fā)展,使得萬事皆可“算”。數(shù)據(jù)已成為新的生產(chǎn)要素,算法和算力已成為新的生產(chǎn)動力,機器智能將成為新的生產(chǎn)工具,數(shù)字經(jīng)濟、數(shù)字社會、數(shù)字生活和數(shù)字治理都將成為智能革命廣闊的主戰(zhàn)場。
一個個橫空出世的新興概念,一場場新概念下的資本狂歡,乃至一瞬間筑起高樓的新興行業(yè)。然而,我們在享受著數(shù)智化時代便利性的同時,也感受到了技術(shù)飛速演進所帶來的困惑及裹挾。我們仿佛剛剛理解了什么是“信息化”,它就升級為了“數(shù)字化”,剛剛才適應了“智能化”社會,現(xiàn)在又面臨著“數(shù)智化”轉(zhuǎn)型;蛟S我們還未曾意識到,新時代意義下的“數(shù)字鴻溝”并非只存在于代際或城鄉(xiāng)之間,實則廣泛存在于主動的概念創(chuàng)造者(掌握著數(shù)字話語權(quán)的知名企業(yè)、大型機構(gòu)、意見領袖等)與被動的概念接受者(普羅大眾)之間。
面對著這些從新行業(yè)中衍生出的一個個新崗位,被新崗位倒逼出的一個個新專業(yè)……作為普通人,我們到底應該選擇躬身入局還是應等待潮水退盡?
無論你是正面臨著數(shù)字化轉(zhuǎn)型的政府或企業(yè)相關負責人,還是數(shù)智化領域的專業(yè)從業(yè)人員,抑或是剛剛畢業(yè)想要進入該領域的技術(shù)小白,或者是我們千千萬萬生活在這個數(shù)智化社會中的普通人。我們都面臨著一個亟需解決的迫切問題:我們應該如何認識并適應如今所處的這個時刻變化中的世界。
在世界百年未有之大變局的今日,這既是巨大的機遇,也意味著艱難的挑戰(zhàn)。在面對未知的恐懼時,本書或可稍稍弭平我們與這些專業(yè)技術(shù)之間的數(shù)字鴻溝,幫助我們形成在數(shù)智化時代下尋求問題解決路徑的專業(yè)化思維模式,讓新技術(shù)更好地服務于我們的美好生活,而非成為被模糊不清的技術(shù)概念操縱的提線木偶。
這也正是我們編著本書的初衷,一方面是為了向政府或者企業(yè)中的非專業(yè)人士科普數(shù)據(jù)智能的相關概念,促進專業(yè)與非專業(yè)人士之間實現(xiàn)更高效、順暢的溝通協(xié)作;另一方面也為即將踏出校門的高校畢業(yè)生們打開數(shù)據(jù)智能領域的大門,畢竟數(shù)智化思維已逐漸成為我們生活和工作中的必備思維。
如上所述,《圖解數(shù)據(jù)智能》是一本為數(shù)字資源的對接方、分配方以及廣大的入門學習者提供相關數(shù)據(jù)智能概念的科普讀物。書中各個概念之間相對獨立,讀者可以將其作為一本檢索用的工具書籍,也可以根據(jù)自己的興趣靈活查閱相關篇章。作為本書的編著團隊,我們基于在零點有數(shù)從事相關領域工作的有限經(jīng)驗,借助數(shù)智化視野,以“數(shù)據(jù)”“算力”“算法”“技術(shù)”和“應用”為主線,為大家將其間涉及的通識性概念進行通俗化的轉(zhuǎn)譯,并以故事化和漫畫化的事例加以呈現(xiàn),力求將晦澀、專業(yè)的概念深入淺出地呈現(xiàn)給大家。
在本書中,我們分為五個篇章為大家解答如下問題。
一、什么是數(shù)據(jù)?我們經(jīng)常接觸到的數(shù)據(jù)類型有哪些?我們?nèi)绾螌@些數(shù)據(jù)進行處理、存放和計算?
二、什么是算法?算法如何賦予機器以智能(智慧)?為什么算法會存在偏見?我們應該如何讓算法對自己的偏見行為負責?
三、什么是算力?我們該如何提升計算能力,以應對大數(shù)據(jù)的快速增長?
四、新一代信息技術(shù)有哪些?它們?nèi)绾螐募夹g(shù)層面徹底顛覆了我們的日常生活?
五、人工智能是如何應用于各行各業(yè),作為普惠科技照亮千家萬戶,甚至成為各國必爭之地的?
張燕玲,四川大學文學碩士,零點有數(shù)營銷總監(jiān),歷任研究總監(jiān),具有10余年數(shù)據(jù)研究工作經(jīng)驗,兩次榮獲中國市場研究行業(yè)專業(yè)論文“寶潔獎”一等獎,發(fā)表文章數(shù)百篇。在推動數(shù)據(jù)智能和算法產(chǎn)業(yè)應用的科普傳播方面具有豐富經(jīng)驗。
許正軍,博士,高級通信工程師,零點有數(shù)技術(shù)副總裁。從事信息通信技術(shù)、互聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、“互聯(lián)網(wǎng)+政務服務”和數(shù)據(jù)智能行業(yè)應用開發(fā)20余年,在各類學術(shù)刊物上發(fā)表過40多篇論文。在數(shù)字政府、數(shù)字社會和數(shù)字經(jīng)濟建設領域具有豐富的理論與實踐經(jīng)驗。
張軍,中國人民大學經(jīng)濟學碩士,零點有數(shù)董事、首席執(zhí)行官,兼任中國信息協(xié)會市場研究業(yè)分會(CMRA)副會長、歐洲民意與市場研究協(xié)會(ESOMAR)中國代表、全球移動通信系統(tǒng)協(xié)會(GSMA)評委等職,多年來致力于公共管理和商業(yè)服務領域的數(shù)據(jù)挖掘與咨詢服務。
第1章 算量 /001
本章導讀 /001
大數(shù)據(jù) /004
結(jié)構(gòu)化數(shù)據(jù) /014
非結(jié)構(gòu)化數(shù)據(jù) /021
特征工程 /026
多源數(shù)據(jù) /034
網(wǎng)絡爬蟲 /038
行為數(shù)據(jù) /042
元數(shù)據(jù) /048
數(shù)據(jù)倉庫 /054
集群系統(tǒng) /059
分布式系統(tǒng) /063
中臺 /068
數(shù)據(jù)加密 /076
第2章 算法 /085
本章導讀 /085
人工智能 /089
算法 /096
模糊計算 /103
機器學習 /108
監(jiān)督學習 /111
無監(jiān)督學習 /116
強化學習 /121
人工神經(jīng)網(wǎng)絡 /127
深度學習 /134
集成學習算法 /139
圖像識別 /148
人臉識別 /155
計算機視覺 /158
無人駕駛 /163
開源算法平臺 /168
算法偏見 /173
算法責任 /179
第3章 算力 /184
本章導讀 /184
算力 /186
DPU /192
AI 芯片 /204
云、云計算、云存儲 /213
公有云、私有云、混合云 /223
邊緣計算 /231
第4章 新一代信息技術(shù) /237
本章導讀 /237
新一代信息技術(shù) /239
數(shù)字新基建 /244
5G /252
物聯(lián)網(wǎng) /260
消費互聯(lián)網(wǎng) /268
產(chǎn)業(yè)互聯(lián)網(wǎng) /273
工業(yè)互聯(lián)網(wǎng) /278
IPv6 /284
集成電路 /290
芯片 /296
傳感器 /301
人機交互 /308
下一代操作系統(tǒng) /311
智聯(lián)網(wǎng) /317
AR/VR /323
數(shù)字孿生 /328
第5章 數(shù)字化轉(zhuǎn)型 /334
本章導讀 /334
網(wǎng)絡強國 /335
數(shù)字中國 /340
智慧城市 /346
城市大腦 /351
數(shù)字底座 /358
數(shù)字化轉(zhuǎn)型 /362
數(shù)智化 /366
數(shù)字政府 /374
數(shù)字經(jīng)濟 /382
數(shù)字化治理 /387
數(shù)字民生 /391
城市生命體征 /395
智能制造 /400
商業(yè)智能 /405
數(shù)字貨幣 /410
強化學習
【導讀】強化學習、監(jiān)督學習和半監(jiān)督學習屬于機器學習的三個大類。強化學習(Reinforcement Learning)又被稱為再勵學習、評價學習或增強學習,是除了監(jiān)督學習和無監(jiān)督學習之外的第三種機器學習方法。
強化學習指的是機器選擇一個動作用于環(huán)境,環(huán)境接受該動作后狀態(tài)發(fā)生變化,同時產(chǎn)生一個強化信號(獎或懲)反饋給機器,機器根據(jù)強化信號和環(huán)境當前狀態(tài)再選擇下一個動作,選擇的原則是使受到正強化(獎)的概率增大。
接下來,將圍繞小美養(yǎng)狗的故事,告訴你什么是強化學習,以及強化學習與監(jiān)督學習、無監(jiān)督學習的區(qū)別。
什么是強化學習
小美家里新養(yǎng)了一只寵物小狗狗,但是初來乍到的狗狗并不懂家里的規(guī)矩,于是,小美想要給它訓訓家規(guī)。
此處,我們請把小狗狗看作機器主體,“它不懂家里規(guī)矩”對應強化學習中的“數(shù)據(jù)無標簽,機器在沒有嘗試前不知道什么是對什么是錯!
第一天,狗狗在家里亂尿尿了,小美打了它,并且罰它半天不能吃狗糧。下午,狗狗去廁所尿尿,小美摸了摸它,并且獎勵了狗狗好吃的。不斷循環(huán)往復,狗狗明白了:在廁所尿尿=主人高興+有好吃的;四處在客廳尿尿=主人不開心+會被打一頓+沒有吃的。慢慢地,狗狗再也不會在家里四處亂尿尿了,變成了一只愛干凈的狗狗。
上述例子中的“狗狗在家里亂尿尿了”對應著強化學習中的“行為”,只有有了行為才有行為所對應的外界的反饋,而這個反饋就是“小美打它,并且不給他吃的”。而后面的“狗狗去廁所尿尿后,小美獎勵食物”對應的是強化學習的“(正)強化信號”。
狗狗(機器)在循環(huán)往復地試錯后,明白了什么是對的,什么是錯的,并且不斷地去趨向?qū)Φ男袨,尋求最佳的表現(xiàn)結(jié)果。
強化學習與監(jiān)督學習的區(qū)別
可能有人會疑問,感覺強化學習和之前咱們提過的監(jiān)督學習很相似呀,都有一個“訓練導師”。
是的,雖然如此,但不同的是:監(jiān)督學習的數(shù)據(jù)有標簽,通過“帶有答案”的數(shù)據(jù)來訓練(例如,你拎著狗狗,去整個屋子的四處全都走一遍,告訴它這是可以尿尿的,而那里是不可以尿尿的)。
而強化學習的數(shù)據(jù)無標簽,只有嘗試了,才能得到反饋(例如,在客廳尿尿了,被打了;在廁所尿尿,被表揚了,并且獎勵了好吃的),從反饋中,調(diào)整之前的行為(狗狗知道了什么是會被表揚的,就會去做,知道了做什么會被打,就不做了),就這樣不斷地調(diào)整,機器能夠?qū)W習到在什么樣的情況下選擇什么樣的行為可以得到最好的結(jié)果(狗狗以后都到廁所去尿尿了)。
強化學習與無監(jiān)督學習的區(qū)別
可能還有人會說,數(shù)據(jù)都是無標簽的,那么強化學習和無監(jiān)督學習不是很像嗎?
不同的是,無監(jiān)督學習是從無標簽的數(shù)據(jù)集中發(fā)現(xiàn)隱藏的結(jié)構(gòu)(例如,狗狗觀察了下家里的環(huán)境,知道了馬桶、垃圾桶和地毯都是圓的,衣柜、電視機、抽屜都是有棱角的)。而強化學習的目標是獲得最大化獎勵的結(jié)果(狗狗內(nèi)心os:我知道在廁所以外的地方尿尿,會被打,在廁所尿尿會被夸,我以后要做一只被獎勵的狗狗)。
總而言之,強化學習就是讓計算機從什么都不懂,通過不斷嘗試,在環(huán)境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,在規(guī)律中學習的一種方法。強化學習的應用很廣泛,無論是日常社交平臺中的推薦、優(yōu)化、猜你喜歡等,還是游戲、自動駕駛,甚至是大家所熟知的蘋果智能語音助手Siri或者是戰(zhàn)勝世界第一圍棋手的阿爾法圍棋(AlphaGo),都有著強化學習的相應嘗試與實踐。