Help: クラスタリング結果からマップ分析する

 71,786件 の科研費研究課題の多次元ベクトルデータをk平均法(k-means clustering)により科研費中区分の区分数と同じ65クラスタに分類し、それぞれのクラスタの代表的なキーワードを関連キーワードとして抽出しました。得られたクラスタと関連キーワードは、トップページまたは右上メニューの「クラスタリング結果からマップ分析する」から一覧できます。

 クラスタ一覧ページでは、クラスタ番号、クラスタのラベル、関連キーワードを一覧できます。また、一覧表右側のボタンから、該当クラスタのデータを注目科学技術マップでプロットして分析できます。

 クラスタのラベルは、関連キーワードやクラスタに所属するデータの内容から付与したものです。関連キーワードは単語の出現回数や、各単語とクラスタ中心の多次元ベクトルの空間上での距離などをもとに単語スコアを算出し、「医療用」「データ」などの広範な意味を持つ単語や「機能」「可能性」など研究分野を直接意味しない単語を除外した上で、単語スコアの上位20語を抽出したものです。

Help 目次