全国最大色成免费网站,免费黃色三級片在线观看18,国产成人拍拍拍高潮尖叫软件

本書基于C#語言介紹網(wǎng)絡(luò)爬蟲開發(fā)的基本原理、技巧和應(yīng)用實(shí)例，適合網(wǎng)絡(luò)爬蟲開發(fā)的愛好者和研究者閱讀。讀者*好具備一定的編程基礎(chǔ)，或者正在學(xué)習(xí)C#編程，以便更好地理解本書的內(nèi)容。
本書具有以下特點(diǎn)：
1）內(nèi)容簡明、由淺入深。本書不追求內(nèi)容上的面面俱到，而是圍繞網(wǎng)絡(luò)爬蟲的核心環(huán)節(jié)，介紹其基本原理和實(shí)現(xiàn)方法，并進(jìn)行適當(dāng)?shù)墓δ軘U(kuò)展。與其他同類書籍相比，本書篇幅適中，適合初學(xué)者閱讀。
2）實(shí)例豐富，代碼翔實(shí)。書中盡量選擇邏輯簡明、功能完整的典型實(shí)例，從需求、設(shè)計(jì)、實(shí)現(xiàn)的角度分別進(jìn)行介紹。而且，幾乎所有實(shí)例都給出了主要實(shí)現(xiàn)代碼，并對(duì)關(guān)鍵代碼進(jìn)行了詳細(xì)注釋，方便讀者進(jìn)行實(shí)踐。

前　　言
雖然Python爬蟲依靠強(qiáng)大的第三方庫能夠快速實(shí)現(xiàn)某些特定功能，但由于這些庫封裝的層次較高，隱藏了大量內(nèi)部細(xì)節(jié)，使用者往往知其然而不知其所以然，遇到問題難以延展。學(xué)習(xí)基于C#的爬蟲開發(fā)雖然起步稍慢，但能夠更好地理解底層網(wǎng)絡(luò)原理和爬蟲架構(gòu)；借助強(qiáng)大的VS平臺(tái)和C#優(yōu)秀的語言特性，更容易開發(fā)出專業(yè)級(jí)的可視化爬蟲工具。相對(duì)于Python的“人生苦短”，我們追求的是“詩和遠(yuǎn)方”。
本書基于C#語言介紹網(wǎng)絡(luò)爬蟲開發(fā)的基本原理、技巧和應(yīng)用實(shí)例，適合網(wǎng)絡(luò)爬蟲開發(fā)的愛好者和研究者閱讀。讀者要是具備一定的編程基礎(chǔ)，或者正在學(xué)習(xí)C#編程，能更好地理解本書的內(nèi)容。
本書具有以下特點(diǎn)：
1）內(nèi)容簡明、由淺入深。本書不追求內(nèi)容上的面面俱到，而是圍繞網(wǎng)絡(luò)爬蟲的核心環(huán)節(jié)，介紹其基本原理和實(shí)現(xiàn)方法，并進(jìn)行適當(dāng)?shù)墓δ軘U(kuò)展。與其他同類書籍相比，本書篇幅適中，適合初學(xué)者閱讀。
2）實(shí)例豐富，代碼翔實(shí)。書中盡量選擇邏輯簡明、功能完整的典型實(shí)例，從需求、設(shè)計(jì)、實(shí)現(xiàn)的角度分別進(jìn)行介紹。而且，幾乎所有實(shí)例都給出了主要實(shí)現(xiàn)代碼，并對(duì)關(guān)鍵代碼進(jìn)行了詳細(xì)注釋，方便讀者進(jìn)行實(shí)踐。
全書共分11章。第1章介紹網(wǎng)絡(luò)爬蟲的基礎(chǔ)知識(shí)，包括網(wǎng)絡(luò)、網(wǎng)頁和爬蟲概述；第2章簡要介紹C#編程，并側(cè)重與網(wǎng)絡(luò)爬蟲相關(guān)的內(nèi)容；第3章介紹網(wǎng)絡(luò)資源下載的方法，并實(shí)現(xiàn)通用資源下載器；第4章介紹網(wǎng)頁數(shù)據(jù)抽取的方法，重點(diǎn)實(shí)現(xiàn)HTML解析器；第5章介紹XML和JSON數(shù)據(jù)抽取的方法，從而獲得更豐富的目標(biāo)數(shù)據(jù)；第6章介紹爬蟲數(shù)據(jù)的存儲(chǔ)，從而將采集結(jié)果保存到文件或數(shù)據(jù)庫；第7章介紹網(wǎng)絡(luò)爬蟲的搜索方式，包括深度優(yōu)先搜索和廣度優(yōu)先搜索，并實(shí)現(xiàn)爬蟲控制器；第8章介紹多線程爬蟲，并實(shí)現(xiàn)自定義線程池以提高爬蟲效率；第9章介紹如何使用代理服務(wù)器，并實(shí)現(xiàn)自定義代理池；第10章介紹常見的瀏覽器內(nèi)核，以及如何使用GeckoFx模擬瀏覽器獲取深層數(shù)據(jù)；第11章介紹抽取模板的表示、管理以及可視化配置方法。
由于網(wǎng)站更新，一段時(shí)間后實(shí)例中的某些URL鏈接可能會(huì)失效，部分網(wǎng)頁結(jié)構(gòu)也會(huì)發(fā)生變化，此時(shí)相關(guān)實(shí)例需要做相應(yīng)的代碼調(diào)整才能正確運(yùn)行。技術(shù)是中立的，本書所述內(nèi)容僅用于技術(shù)交流，任何人若將相關(guān)技術(shù)用于商業(yè)或其他用途，需自行承擔(dān)由此產(chǎn)生的影響和后果。
致謝
在本書即將出版之際，首先感謝我的合作者種惠芳老師，種老師專業(yè)過硬、認(rèn)真負(fù)責(zé)，承擔(dān)了大量撰寫工作；特別感謝恩師張克亮教授一直以來對(duì)我的指導(dǎo)和鼓勵(lì)；感謝易綿竹教授、馬延周副教授、唐亮副教授、王亞利副教授對(duì)本書提出的許多寶貴意見；感謝任靜靜老師、張婷老師、沈麗民老師、王帥鴿老師參與了本書初稿的校對(duì)。最后，感謝我的妻子趙盼，她對(duì)家庭雙倍的付出才讓我有時(shí)間完成本書。
限于作者的學(xué)識(shí)，書中難免有表述不當(dāng)或疏漏之處，懇請(qǐng)各位讀者指正。
李健
2022年5月

你還可能感興趣

我要評(píng)論