EXPERTISES

核心技術

藍星球專注中文資料處理技術

不斷鑽研智慧化的文本分析、相似文件群集、前後文自動化串聯等探勘技術,在龐大的資料中找出關鍵精華

透事THOUGHTS:
中文探勘分析系列技術
點我

透事系列技術,是藍星球專注研發中文分析演算的核心成果,可為大量資料進行智慧分類、自動摘要、詞彙萃取、情緒感測及精準推薦。客戶系統多元運用此系列技術,聰明準確,獨樹一格。

系列技術亦推出API服務,點此看更多
中文檢索引擎

針對中文字博大精深及變化,藍星球資訊發展完整支援容錯/簡繁體/異體字的檢索引擎。

數位⼈文架構

提供符合數位人文資料庫之架構及詮釋資料與全文資料的自動化處理。無論原始資料格式為結構化、半結構化、非結構化之型態,皆可透過藍星球資訊的「自動化資料豐富程序」將資料對應都柏林核心集 (Dublin-Core) 格式,並去除無效、重覆或空白之噪音,將資料正規化處理。並擷取出資料中重要之特徵資訊 (如人、事、時、地、物),並直接轉換成一套能支援簡繁體中文檢索、具備人、事、時、地、物檢索後分類、具備時間軸檢視、具備空間軸檢視等功能。