詞條
詞條說明
Nlpir Parser智能平臺靈玖軟件新推出的文本挖掘系統
文本挖掘已經成為數據挖掘中一個日益流行而重要的研究領域。與一般數據挖掘以關系、事務和數據倉庫中的結構數據為研究目標所不同的是,文本挖掘所研究的文本數據庫, 由來自各種數據源的大量文檔組成。這些文檔可能包含標題、作者、出版日期、長度等結構化數據, 也可能包含摘要和內容等非結構化的文本成分,而且這些文檔的內容是人類所使用的自然語言,計算機很難處理其語義。因此傳統的信息檢索技術已不適應日益增加的大量文
大數據是一個包括一切的術語,指的是數據集很大很復雜,他們需要特別設計的硬件和軟件工具。數據集通常是 T 或者較大級別。這些數據集從各種各樣的來源創建,包括傳感器,收集氣象信息,公開可用的信息,如雜志、報紙、文章。還包括購買交易記錄、網絡日志、醫療記錄、軍事偵察、視頻和圖像檔案和大規模的電子商務等等。 JZSearch大數據搜索引擎是靈玖軟件聯合中科院與北理工的信息檢索*,針對大數據搜索業務需求
在信息化高度發達的今天,互聯網已經成為人們獲取信息,即時溝通的重要媒介之一,給人們工作生活帶來了很大的便利。但是由于其**性、開放性、即時性的特點,互聯網也成為眾多信息傳播的重要途徑,與傳統媒體相比較為棘手。如何對互聯網進行有效的管理,過濾其中的不良信息,凈化網絡環境成為苛待解決的問題。 目前網絡中70%的信息是以文本形式存在,網頁文本過濾成為目前網絡監控的較重要手段。文本過濾方法有很多,關鍵字
伴隨著計算機的日益普及,互聯網的迅猛發展,文本的數量(電子郵件、新聞、網頁、科技論文等)在不停的增長,因而對文本作智能化處理以獲取所需信息的需求日益迫切。在這樣的社會需求下,自然語言處理技術的地位和作用日益重要。經過幾十年的研究,計算機 處理自然語言的理論基礎日趨成熟,應用范圍也越來越廣,初步形成了面向各種不同應用和研究的技術體系。分詞作為自然語言處理的* 一個步驟,是其他高層應用的基礎,起著較
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: