Wikipedia-based Bayes framework to Beef up Query texts

自然文の入力に対して,文脈的に関連性の高いWikipediaの記事を推測・付与し,そのテキストが言及しているトピックを補強(Beef up)するシステムです.

現在,サーバトラブルのためサービス停止中です.

クエリ拡張や文書クラスタリング,広告マッチングなど,様々な応用が考えられます.

使用されている技術

WikiBBQでは,Wikipediaから抽出可能な様々な情報をベースとし, 拡張ナイーブベイズ(extended naive Bayes)を用いて,

1) 入力テキストからの特徴語の抽出
2) 特徴語からの関連語取得(関連度計算)
3) 複数の特徴語から構成されるコンテキストを考慮した関連語の集約

を一つの枠組みに落とし込み,自然文に対する関連語を推測しています.

これにより,パラメータフリーでロバストな関連語推測が可能になります.

文献

白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: Wikipediaとナイーブベイズを用いた自然文に対する関連語句取得手法, 第4回データ工学と情報マネジメントに関するフォーラム (DEIM2012) (2012年3月). (優秀論文賞).

Masumi Shirakawa, Kotaro Nakayama, Takahiro Hara and Shojiro Nishio: Probabilistic Semantic Similarity Measurements for Noisy Short Texts Using Wikipedia Entities, 21st ACM International Conference on Information and Knowledge Management (CIKM), pp. 903-908 (Oct./Nov. 2013).

Masumi Shirakawa, Kotaro Nakayama, Takahiro Hara and Shojiro Nishio: Wikipedia-based Semantic Similarity Measurements for Noisy Short Texts Using Extended Naive Bayes, IEEE Transactions on Emerging Topics in Computing, Vol. 3, Issue 2, pp. 205-219 (June 2015).

案内

ツールボックス

検索