電腦普及帶來的一個結果是文檔以數字形式呈現出來,加之Internet的廣泛使用,這些文檔就變得唾手可得。文本挖掘,即對非結構化的自然語言文本的分析過程,主要針對的是如何從這些文檔中提取信息?!额A測性文本挖掘基礎》是一本入門級的教科書,是在修訂施普林格已經成功出版的文本挖掘領域的參考書基礎上得到的,旨在能夠幫助讀者了解這個快速發(fā)展的領域。同時,該書也整合了包括數據挖掘、機器學習、數據庫以及計算語言學方面很多的理論,因此這本獨一無二的書也提供了一些文本挖掘方面比較實用的建議。書中深層次地討論了文檔分類、信息檢索、聚類和組織文檔、信息提取、基于web的數據源的預測和評價問題。要學習《預測性文本挖掘基礎》,如果讀者有數據挖掘方面的知識自然很好,但這并不是必須的。書中有些地方涉及到一些高級概念,這些需要讀者有一定的數學功底,當然我們也提供了一些直觀上的解釋來幫助那些非專業(yè)讀者。