演題番号 | 2E1-01 |
---|---|
題目 | 語の共起情報を用いた文書クラスタリング |
著者 | 小熊 淳一 (電気通信大学電気通信学部システム工学科) 内海 彰 (電気通信大学システム工学科) |
時間 | 6月16日(木) 09:00〜09:20 |
概要 | 本研究では,文書クラスタリングのための2種類の文書ベクトル構成法を提案し,文書クラスタリングの性能について既存手法とともに比較検討する.提案する手法は,語のつながりに着目し,語の共起回数と語の頻度情報を併せて文書ベクトルを構成する方法と,共起グラフから得られる重要語に着目し,共起情報に基づいた語の重要度を用いて文書ベクトルに重みをつける方法である. |
論文 | PDFファイル |