Social and Fintech news Summarization System
社群與財經新聞摘要系統

  研究的目標主要分為兩個部分,第一部份使用者透過關鍵字搜尋相關新聞文本,接著對多文本進行分析,例如新聞之標題、內文、類別,而藉由根據上述文本探勘獲得的內容,視為最能代表該新聞之重要關鍵字,第二部分針對文本中具有相關關鍵字的句子進行提取式摘要技術,濃縮多文本成單一摘要內容,藉以減低人力與時間成本。在數量上,由多個新聞文本作為來源進行摘要,不同於單一新聞文本(single-document summarization)只由一篇新聞中進行摘要,因此技術上稱為多文本摘要技術(multi-documents summarization);另外,在摘要方式上,採用提取式技術(extraction-based summarization),基於一個假設,一篇文檔的核心思想可以用文檔中的某一句或幾句話來概括。這個方法需要從原文中找出相對來說重要的句子來組成輸出,系統需要用模型來選擇出信息量大的句子,然後按照自然序組合起來形成摘要。

 Back