![]() |
名前 | 熊坂 夏彦 |
|---|---|---|
| 所属 | 慶應義塾大学理工学部 | |
| 学位 | 博士(理学) 慶應義塾大学 | |
| 研究分野 | データヴィジュアリゼーション,データサイエンス | |
| HP | http://stat.math.keio.ac.jp/kumasaka/J/ |
研究概要:
Textile Plot (Kumasaka and Shibata, 2006) は大規模でしかも高次元なデータの的確な理解を目的とするデータヴィジュアリゼーション手法の一つである.これは,Inselberg(1985) やWegman(1990)によって提案されたParallel Coordinate Plotを基本としているが,数値データだけでなく類別データさらには順序付き類別データまで, 汎用にしかもその背後にある属性情報まで有機的にWarpと呼ばれる一つの統合表現によって視覚化する.
Textile Plotは単にデータを表示するだけでなく,ユーザが高次元データの背後に存在する構造の的確な理解を助けるため,Weft と呼ばれる各観測のパスを可能な限り水平にするような基準で各Warpの位置と尺度を変換する.このような基準で最適な位置と尺度を求めることで,Pararell Coordinate Plot にみられる乱雑な Weft の配置を避けられるだけでなく,類別データの水準の適切な位置を定めることができる.
Textile Plot上に現れる二つの特筆すべき特徴として,Kont とParallel Weft がある.これらは高次元データにおける変量の直交性と線形性をそれぞれ表しており,Kumasaka and Shibata (in press) ではこの二つの特徴が表れる条件を数学的に明らかにするだけでなく,データの構造を理解する重要な手がかりになることをいくつかの実データで検証した.またWarpの順序に関しても,各座標ベクトルの分散の大きさによる基準と,隣り合うWarp間のWeftの傾きの絶対値和を距離としたクラスタリングによる基準の二つを提案している.前者の基準は観測の区別に役立つ主要な軸を見つけるのに役立ち,後者は各軸,つまり変量間の階層的な構造を理解するのに役立つ.
さらにこの汎用な視覚化手法Textile Plot を用いることで,高次元データの的確な認識を可能にする一つの体系的な環境の設計と実装についても熊坂,柴田 (2007) で提案した.Textile Plot環境は,Data, Parallel Coordinate, Visual Analogue, Textile Plotの4つのオブジェクトの流れで構成され,ユーザの視覚的操作を体系的に処理する.Dataオブジェクトは座標ベクトルの集まりであるParallel Coordinateオブジェクトに変換され,Parallel Coordinate オブジェクトはTextile Plotとは相似であるがその抽象表現であるVisual Analogueオブジェクトに変換される.さらにVisual Analogueオブジェクトは現実のディスプレイ,すなわちサイズや解像度に依存しないTextile Plotオブジェクトへと変換される.ユーザは最終的にこのTextile Plotオブジェクトをさまざまなインタフェイスを通じて眺めることになる.このようにデータからのTextile Plotの生成を一連のオブジェクトの変遷とみなすことで,対話的な操作を各オブジェクトに適切に振り分け,同時にそのログも保存することも可能となる.