演題番号 | 1F3-01 |
---|---|
題目 | 局所尤度推定に基づくノイジーデータからの大規模分散クラスタリング |
著者 | 佐久間 淳 (東京工業大学総合理工学研究科知能システム科学専攻) 小林 重信 (東京工業大学総合理工学研究科知能システム科学専攻) |
時間 | 6月15日(水) 15:10〜15:30 |
概要 | 本研究では1回のデータのフルスキャンが極めて高コストであるような大規模データセットが数千_から_数万のクラスタを含むような状況を想定し,それらを分散計算機環境下で効率的に推定 する方法について,確率モデルの推定に基づく大規模分散クラスタリング法を提案する.$k$-mean法やEM法に代表されるクラスタリング手法は実装が容易で頻繁に利用されるが,クラスタ 数$k$をあらかじめ与える必要があること,データのフルスキャンが必要であるなど,大容量のデータクラスタリングには望ましくない性質がある.変分ベ |
論文 | PDFファイル |