概要
オントロジーの中でも幅広い分野の一般的知識を記述した汎用(言語)オントロジーは,現在では英語版としてはWordNet,日本語版としてはEDR電子化辞書がよく知られており,セマンティックWeb研究における貢献度は非常に高い.しかし,これらのオントロジーは膨大な時間とコストをかけて人手で構築されているため,固有名詞も含め,日々生まれ出る新しい語彙定義への即時対応が難しいのが現状である.
そこで本研究では,即時更新性,語彙網羅性に優れたオンライン百科事典Wikipediaから汎用オントロジーを構築することを目的とする.Wikipediaの半構造化された情報資源に着目し,これをオントロジーに変換する.Wikipediaカテゴリ階層に対する文字列照合を行うことによってオントロジーのクラス階層を構築し,一覧記事に対するスクレイピングを行うことによってインスタンスを収集する手法を提案する.
ダウンロード
試験的に公開中.
SourceForge.JP Wikipedia Ontologyプロジェクトページプロジェクトメンバー
- 桜井 慎弥(慶應義塾大学)
- 手島 拓也(慶應義塾大学)
- 森田 武史(慶應義塾大学)
- 山口 高平(慶應義塾大学)
連絡先
- 桜井慎弥 (s_saku@ae.keio.ac.jp)
- 山口高平 (yamaguti@ae.keio.ac.jp)