Wikipediaを用いた上位概念間の関係抽出

Wikipediaのテキスト(英語)を対象とし,テキストから上位概念間の関係を抽出しています.

関係数は7,409,974です(少しノイズがあるかもしれません).

抽出した関係(tsvファイル)は以下よりダウンロードできます.

http://iwnsew.com/download/vrelation.zip

一行ごとに以下のように関係が記述されており,[上位概念A][動詞][上位概念B]がそのまま関係となります.

上位概念A  動詞  上位概念B  出現頻度

なお,上位概念にはFreebaseのTypeを用いています.


過去の研究

WikipediaとWebの情報を用いた動作関係辞書

案内

ツールボックス

検索