世界連在一起，搜尋引擎的核心秘密 - 香港書城網上書店 Hong Kong Book City

世界連在一起，搜尋引擎的核心秘密

作者:	張俊林
譯者:	王偉任
書城編號:	753295

售價: $120.00

購買後立即進貨, 約需 7-12 天




出版社:	博碩
出版日期:	2012/09
頁數:	352
ISBN:	9789862016367

商品簡介

搜尋引擎作為網際網路發展中非常重要的一種應用，已經成為網際網路各個領域中的制高點，其重要性不言而喻。搜尋引擎領域也是網際網路應用中以核心技術作為其主要命脈的領域，搜尋引擎各個子系統是如何設計的呢？這值得成為廣大技術人員和搜尋引擎機制優化人員密切關心的內容。

本書的最大特點為內容新穎全面且通俗易懂。對於搜尋引擎所涉及的各種核心技術都有全面且詳細的介紹，除了作為搜尋系統核心的網路爬蟲、索引系統、排序系統、連結分析及使用者分析之外，還包括網頁反作弊、快取管理、相似網頁抄襲偵測…等技術於搜尋引擎必須關心的技術，同時使用相當大的篇幅講解雲端運算與雲端儲存的核心技術原理。此外，本書也密切注意搜尋引擎發展的前沿技術：Google咖啡因系統及Megastore等雲端運算新技術、百度的深層網頁抓取技術阿拉丁計畫、內容農場作弊、機器學習排序…等。諸多新技術在相關章節都有詳細的講解，同時對於社交搜尋、即時搜尋及情境搜尋…等搜尋引擎的未來發展方向進行探討。為了增進讀者對於相關技術的了解，在書中引入大量的圖片來講解演算法的運作原理，相信讀者會發現原來搜尋引擎的核心技術比原先想像的要簡單得多。

本書適合對於搜尋引擎技術感興趣的所有使用者，尤其對於相關領域的學生以及對於搜尋引擎核心技術感到好奇的技術人員，並且對於從事搜尋引擎機制優化的相關人員及中小網站的站長…更具有參考價值。
誰適合嬝玟o本書
如果您是下列人員之一，那麼本書便非常適合您嬝炕C

1. 對於搜尋引擎核心演算法有興趣的技術人員
搜尋引擎的整體架構為何？包含哪些核心技術？
網路爬蟲的基本架構為何？常見的網頁爬取原則策略？何謂深層網頁爬取？如何建構分散式爬蟲？百度的阿拉丁計畫內容為何？
何謂反向索引？如何針對反向索引進行資料壓縮？
搜尋引擎如何對搜尋結果排序?
何謂向量空間模型？概率模型？BM25模型？機器學習排序？它們之間有何差異？
PageRank和HITS演算法為何關係？有何差異？SALSA演算法？Hilltop演算法？各種連結分析演算法之間有何關係？
如何辨識使用者搜尋的真正搜尋意圖？使用者搜尋目的可以分為幾類？何謂點擊圖？何謂查詢會話？相關搜尋機制是如何達成的？
為什麼要對網頁進行重複內容刪除機制？如何對網頁進行重複內容去除？哪種演算法效果比較好？
搜尋引擎快取有幾層結構？核心原則為何？
何謂情境搜尋？社交搜尋？即時搜尋？
搜尋引擎機制有哪些發展趨勢？您對其中三個以上的議題感到興趣，那麼本書就是為您而寫的。

2. 對於雲端運算與雲端儲存技術有興趣的技術人員
何謂CAP原理？ACID原理？它們之間有什麼差異？
Google的整套雲端運算架構中包含哪些技術？Hadoop和Google的雲端運算架構有什麼關係？
Google的三駕馬車GFS、BigTable、MapReduce各自代表什麼含義？其關係為何？
Google的咖啡因系統其基本原理為何？
Google的Pregel運算模型和MapReduce運算模型有什麼區別？
Google的Megastore雲端儲存系統和BigTable關係為何？
Amazon的Dynamo系統為何？
Yahoo的PNUTS系統為何？
Facebook的Haystack儲存系統適合應用於什麼場合上？
如果您對上述問題感興趣，相信可以從書中找到答案。

3. 從事搜尋引擎優化的網路行銷人員及中小網站站長
搜尋引擎的反作弊策略為何？如何在進行優化時避免被誤認為是作弊行為？
搜尋引擎如何對搜尋結果進行排序？連結分析和內容排序關係為何?
何謂內容農場？連結農場？它們之間的關係為何？
何謂Web2.0作弊？有哪些常見手法？
何謂SpamRank？TrustRank？BadRank？它們之間的關係為何？
咖啡因系統對於網頁排名有何影響？

最近有一些電子商務網站...

* 以上資料僅供參考之用, 香港書城並不保證以上資料的準確性及完整性。
* 如送貨地址在香港以外, 當書籍/產品入口時, 顧客須自行繳付入口關稅和其他入口銷售稅項。

顯示模式: 電腦版 (改為: 手機版)