在大數(shù)據(jù)時代,數(shù)字被看作是巨大的金礦,變得****地重要。人們可以通過一串串數(shù)字刻畫整個世界,甚至預測未來。但是數(shù)字卻永遠無法代替真實,現(xiàn)在數(shù)字和數(shù)據(jù)被濫用的現(xiàn)象越來越常見,特別是新技術的運用更是使數(shù)據(jù)從收集到處理,從可視化到信息表達,每個環(huán)節(jié)都存在用數(shù)字做手腳的機會,讓人防不勝防。不過數(shù)字永遠都是那些數(shù)字,說謊的并不是數(shù)字本身,而是使用數(shù)字的人,是數(shù)字使用者把數(shù)字變成了“任人打扮的小姑娘”。
本書將用簡單易懂的語言分析常見的利用數(shù)字說謊的情況,并結合一些常見的例子,對現(xiàn)有的一些“數(shù)字陷阱”現(xiàn)象進行解析。
第1章 數(shù)字、數(shù)據(jù)與統(tǒng)計 /1
1.1 數(shù)字與統(tǒng)計學 /2
1.1.1 數(shù)字不僅僅是算算術 /2
1.1.2 我們?yōu)槭裁葱枰y(tǒng)計學? /4
1.1.3 生活中統(tǒng)計學無處不在 /8
1.2 大數(shù)據(jù)時代 /11
1.2.1 大數(shù)據(jù)對生活的影響 /11
1.2.2 數(shù)據(jù)過多既是負擔,也是隱患 /13
第2章 數(shù)字的意義 /17
2.1 預測比賽結果/冠軍歸屬 /18
2.1.1 足球博彩與奪冠賠率 /18
2.1.2 高盛預測2014年世界杯走勢 /21
2.1.3 人工智能預測《我是歌手》冠軍歸屬 /24
2.2 數(shù)字預測美國大選 /26
2.2.1 美國大選的計票方式 /26
2.2.2 538網(wǎng)站成功預測奧巴馬當選 /28
2.2.3 統(tǒng)計數(shù)字比政治學家更可靠? /31
2.3 用網(wǎng)絡數(shù)據(jù)幫你賺錢 /34
2.3.1 語意分析——你在網(wǎng)上說過的話都蘊藏商機 /34
2.3.2 Twitter和Google中隱藏的賺錢秘密 /36
2.3.3 利用社交網(wǎng)絡數(shù)據(jù)看股市走勢 /40
2.4 數(shù)字與量化對學科研究的影響 /45
2.4.1 定性分析與定量分析 /45
2.4.2 社會科學中的量化研究 /46
2.5 媒體也在到處找數(shù)據(jù) /50
2.5.1 數(shù)字對媒體傳播的重要性 /50
2.5.2 數(shù)據(jù)新聞和數(shù)據(jù)可視化的崛起 /52
第3章 數(shù)據(jù)收集既有技巧又有隱患 /57
3.1 從哪里能夠獲得數(shù)據(jù)? /58
3.1.1 二手數(shù)據(jù) /58
3.1.2 一手數(shù)據(jù) /59
3.2 什么樣的數(shù)據(jù)是好數(shù)據(jù)? /61
3.2.1 好數(shù)據(jù)的標準 /61
3.2.2 清洗數(shù)據(jù)也是技術活兒 /62
3.3 你的數(shù)據(jù)可靠嗎 /64
3.3.1 數(shù)據(jù)來源不可靠 /64
3.3.2 對數(shù)字本身做手腳 /65
3.3.3 對數(shù)據(jù)后期處理過度 /66
3.4 樣本選擇不完善 /68
3.4.1 樣本選擇與整體數(shù)據(jù) /68
3.4.2 樣本選擇偏差:失之毫厘,差之千里 /69
3.4.3 幸存者偏差:你經(jīng)歷的不一定就是真的 /72
第4章 相關性與因果性 /79
4.1 相關性與因果性的混淆 /80
4.1.1 相關關系不一定意味著因果關系 /80
4.1.2 購物網(wǎng)站怎么會知道我想讀什么書 /81
4.1.3 “神奇的”相關性 /82
4.2 慎用“因為……所以……”造句:因果關系不可亂用 /85
4.2.1 因果關系需要嚴密論證 /85
4.2.2 “倒因為果”也是一個嚴重的問題 /87
第5章 平均數(shù)的“挑選技巧” /89
5.1 平均數(shù)、中位數(shù)與眾數(shù)的差別 /90
5.2 平均數(shù)并不“平均” /92
5.2.1 當?shù)仄骄べY水平×萬元,你被平均了嗎? /92
5.2.2 占領華爾街——社會上1%的人掌握了99%的財富 /95
5.3 缺少平均數(shù)的誤導性 /98
5.3.1 GDP全球第二,我國是否已經(jīng)是經(jīng)濟強國? /98
5.3.2 我國是地大物博、資源豐富嗎? /100
5.4 辛普森悖論:分類的重要性 /102
5.4.1 到底哪個班的平均分高? /102
5.4.2 辛普森悖論 /104
5.5 補救平均數(shù) /105
5.5.1 全國收入水平分布情況——你處在哪個位置? /105
5.5.2 房價的中位數(shù)乘數(shù) /107
第6章 數(shù)字圖表——有圖也不一定有真相 /111
6.1 數(shù)字與數(shù)據(jù)可視化:一圖勝千言 /112
6.1.1 數(shù)字越詳細,人們反而越不愿意看 /112
6.1.2 人類對圖形更加敏感 /113
6.1.3 數(shù)據(jù)可視化的趨勢與優(yōu)勢 /115
6.2 可視化的數(shù)字也是數(shù)據(jù)陷阱的重災區(qū) /117
6.2.1 圖形數(shù)據(jù)更加直觀,但可能會遺漏一些數(shù)據(jù)信息 /117
6.2.2 圖像更易操縱 /120
6.3 改變坐標軸:數(shù)字變得不認識了 /121
6.3.1 截取縱坐標某一段,故意夸大差距 /121
6.3.2 圖像的拉長與伸縮 /124
6.3.3 改變時間軸的范圍:視角不同,“結果”就不同 /125
6.3.4 百分號和千分號:單位到底是什么? /129
6.4 魔鬼都藏在細節(jié)中 /131
6.4.1 查看數(shù)據(jù)備注說明信息 /131
6.4.2 注意數(shù)據(jù)圖表的細節(jié) /132
第7章 廣告中的數(shù)字陷阱 /137
7.1 “降價50%銷售”:真的是降價促銷嗎? /138
7.1.1 先漲價后降價 /138
7.1.2 先降價后漲價 /139
7.2 買家好評:口碑就是金錢 /141
7.2.1 信息不對稱——賣家怎么說都有理? /141
7.2.2 刷單導致偏差 /142
7.2.3 “給好評送禮物” /143
7.3 夸張宣傳誤導消費者 /145
7.3.1 一周美白:公開的數(shù)字與背后的信息 /145
7.3.2 前提條件不明——隱藏的技巧 /146
7.4 流量為王的時代 /149
7.4.1 能到“10萬+”才算火爆 /149
7.4.2 賺流量也要守規(guī)矩 /150
第8章 公司運營中的數(shù)字陷阱 /153
8.1 營業(yè)收入與利潤 /154
8.1.1 賣得越多,賺得越多? /154
8.1.2 所謂“互聯(lián)網(wǎng)思維”——先燒錢圈地,再考慮盈利? /156
8.2 增長:環(huán)比增長還是同比增長? /161
8.3 企業(yè)帶動納稅5000億元 /163
8.4 注水的KPI /164
8.4.1 KPI是用數(shù)字量化來考核的方式 /164
8.4.2 只要有數(shù)字就可能被操控——虛假業(yè)績的例子 /165
第9章 網(wǎng)絡謠言中的數(shù)字陷阱 /167
9.1 為什么謠言比辟謠更受歡迎? /168
9.1.1 人類偏好聳人聽聞的故事 /168
9.1.2 帶有數(shù)字的謠言更可怕 /169
9.1.3 謠言通常比充滿科學味的枯燥辟謠文章更具有可讀性 /171
9.2 食物相克的謠言:離開劑量談毒性都是耍流氓 /173
9.3 生男孩還是生女孩——酸兒辣女? /174
第10章 美國大選預測遭遇滑鐵盧:特朗普來了 /175
10.1 總統(tǒng)大選,誰家預測得準 /176
10.2 尷尬的媒體和民調(diào)預測 /179
10.3 預測正確的媒體 /182
第11章 數(shù)字與新技術時代 /185
11.1 人工智能、機器學習、大數(shù)據(jù):數(shù)字新時代 /186
11.2 新技術前景 /189
11.3 人類必須要面對的現(xiàn)實:被機器取代 /191
11.4 安全隱患 /194
第12章 總結 /197