セミナー

談話会

タイトル データ空間の曲率を利用した統計的解析
開催日時 2015年5月1日 17:00~18:00 
主催者
講演者 小林景 氏 (統計数理研究所)
場所 矢上キャンパス14棟631A/B
内容 統計学や機械学習において解析対象となるデータは,通常数ベクトルの形をしている. よって自然にユークリッド空間やヒルベルト空間上の点集合と同一視できる.しかし, 実際にはデータはユークリッド空間の一部分や特定の幾何対象(データ空間とよばれる) の上,もしくはその近くにのみに存在する場合も多い.本研究では,データ空間が 測地距離空間であると仮定した上で,データ空間の曲率の情報を用いた統計解析を 行うことにより,その解析精度を向上させる方法を提案する. このような方針の初期研究として,データ空間の曲率と内側平均(intrinsic mean,Frechet mean)の一意性に関する研究がある.内側平均は,通常のベクトル標本の標本平均を, リーマン多様体や多面体的複体などの測地距離空間上に標本が分布する場合に一般化した ものであり,その一意性はデータ空間の曲率に依存する.既存研究においては, データ空間は球面などの単純な図形に限って議論される場合が多かったが, 本研究では曲率の指標としてGromovらによって提案されたCAT(k)を用い, また経験グラフによる近似を導入することにより,より複雑なデータ空間について 曲率を用いた手法の提案とその理論評価を行う. また,単にデータ空間の曲率を推定するだけでなく,その曲率を変化させることにより クラスタリングなどのデータ解析の改良を提案する.具体的には,密度関数のべき乗の積分 による局所的な測地距離の変換と,特定の凹関数による大域的な距離の変換の二段階で距離を 変化させる.これらはそれぞれ,データ空間の曲率の変化と,データ空間が埋め込まれる 計量錘(metric cone)の曲率の変化に対応している. 本研究はHenry P. Wynn(London School ofEconomics)との共同研究であり, 本発表の内容はarXiv1401.3020をもととしている.
資料
URL

PAGETOP