透事

藍星球擁有業界最豐富的文字探勘經驗,我們致力於替每位客戶從巨量文本數據中,挖掘出最富價值的資訊。無論是網路輿情監測、商業授信分析,抑或是各式非結構化資料處理,我們都能協助您探索其中的洞見與關係。

智慧分類

智慧分類

快速辨識文本內容、自動分門別類;以輿情資料為例,可精準判斷討論主題屬於政治社會、生活休閒、金融經濟等何種類型。

自動摘要

採句子重要性評分運算,將長篇文章拆解為句子型式子單位,換算句子在文章中的位置、句子構成特徵、與文章其他句子於向量空間的相對距離關係,以此得出每個句子在文章向量空間的重要程度,再由文章重組模型參照重要程度重新產出具高可讀性的20%、50%、80%摘要內容。

自動摘要
詞彙萃取

詞彙萃取

以機器學習為基礎,透過解構句子內的最小實體單位、大量學習文章用語樣式(pattern),自動化萃取文本中的人物、組織團體、地點、企業品牌、關鍵字等詞彙。

情緒感測

針對中文文本的情緒判讀主要是透過改良長短期記憶網路(LSTM)方法、調整忘卻閥(forget gate)Sigmoid層函數,同時導入藍星球中文標註參照集,強化篩選前次傳入的訊息特徵後,用以判斷該訊息是否具備某些隱藏特徵,例如詞語挪用機率、語境分類等,從而提升判讀準確率。

情緒感測
猜你喜歡

猜你喜歡

彙整巨量資料,依據文本內容,進行文本詞彙間的關聯運算。提供使用者可能喜歡的內容。

觀點聚類

透過巨量資料的剖析,將相似內容分別歸納為各個群聚、轉為分群問題,可應用於多筆評論資料,無論當前數種觀點風向、討論熱度為何,皆能全盤掌握。

觀點聚類

尚無相關文章