《Web數據挖掘》旨在講述這些任務以及它們的核心挖掘算法;盡可能涵蓋每個話題的廣泛內容,給出足夠多的細節(jié),以便讀者無須借助額外的閱讀,即可獲得相對完整的關于算法和技術的知識。其中結構化數據的抽取、信息整合、觀點挖掘和Web使用挖掘等4章是《Web數據挖掘》的特色,這些內容在已有書籍中沒有提及,但它們在Web數據挖掘中卻占有非常重要的地位。當然,傳統(tǒng)的Web挖掘主題,如搜索、頁面爬取和資源探索以及鏈接分析在書中也作了詳細描述。《Web數據挖掘》盡管題為“Web數據挖掘”,卻依然涵蓋了數據挖掘和信息檢索的核心主題;因為Web挖掘大量使用了它們的算法和技術。數據挖掘部分主要由關聯(lián)規(guī)則和序列模式、監(jiān)督學習(分類)、無監(jiān)督學習(聚類)這三大最重要的數據挖掘任務,以及半監(jiān)督學習這個相對深入的主題組成。而信息檢索對于Web挖掘而言最重要的核心主題都有所闡述。