Home
 

Progressive Sequential Pattern Mining

漸進式循序性樣式探勘(Progressive Sequential Pattern Mining)

   循序性樣式探勘在資料探勘領域中已發展多年,然而過去的研究多著重在靜態資料庫的循序樣式探勘,亦有部分學者討論增加新資料到資料庫中,隨著時間的推移,循序性的資料不斷地累積,久遠以前的資料仍然存留在資料庫中,這些保存在資料庫中過時的資料,卻會影響到即時的循序樣式的產生,過去已有多項研究針對靜態資料庫與不斷增加的資料庫找尋循序性樣式,但在刪除舊資料和過時的循序樣式上尚無有效率的方法。我們提出一個普遍性的循序性樣式架構,稱為漸進式資料庫(如圖一),並使用一個持續前進的區間來加進新資料與移除舊資料,同時我們也研發相關演算法,此漸進式資料庫的演算法利用一個特殊的樹狀資料結構(如圖二)來儲存資料庫中所有循序性樣式的資訊,不但能找出靜態的循序樣式,也能有效率地增加新的資料或是刪除過時的資料,以找尋最即時的循序性樣式,並且此普遍性演算法也可適用於傳統的靜態式資料庫或是不斷增加的資料庫上。其成果發表於ACM International Conference on Information and Knowledge Management國際會議及SCI Computer Science領域之IEEE Transactions on Knowledge and Data Engineering期刊。

  • J.-W. Huang, C.-Y. Tseng, J.-C. Ou, and M.-S. Chen, "On Progressive Sequential Pattern Mining," Proc. of the ACM 15th International Conference on Information and Knowledge Management (CIKM'06), pp. 804-805, November 6-11, 2006.
  • J.-W. Huang, C.-Y. Tseng, J.-C. Ou, and M.-S. Chen, "A General Model for Sequential Pattern Mining with a Progressive Database," IEEE Trans. on Knowledge and Data Engineering, Vol. 20, No. 9, pp. 1153-1167, 2008(September).

分散式漸進式循序性樣式探勘(Distributed Progressive Sequential Pattern Mining)

    結合雲端運算技術,可將大量的資料做分散式的處理,能同時提高計算的效率與實用性。我們探討在漸進式資料庫上如何研發有效率的分散式循序樣式探勘系統,成功地運用雲端技術將問題分散處理,設計出分散式的循序樣式分析演算法。其成果發表於ACM Pacific-Asia Conference on Knowledge Discovery and Data Mining國際會議。

  • J.-W. Huang, S.-C. Lin and M.-S. Chen, "DPSP: Distributed Progressive Sequential Pattern Mining on the Cloud," Proc. of the 14th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD'10), June 21-24, 2010.
  • J.-W. Huang, C.-Y. Tseng, J.-C. Ou, and M.-S. Chen, "A General Model for Sequential Pattern Mining with a Progressive Database," IEEE Trans. on Knowledge and Data Engineering, Vol. 20, No. 9, pp. 1153-1167, 2008(September).


© Knowledge and Information Discovery Lab, National Cheng Kung University. Last update: 2019/10/01