新着情報
- 2010-12-11: 日本語Wikipediaオントロジー ver.2010.01.26を公開しました.
- 2009-03-25: 日本語WikipediaオントロジーをSourceForge.jpで公開しました.
概要
Wikipedia は語彙網羅性および即時更新性に優れており,半構造情報資源であることからフリーテキストと比べてオントロジーとのギャップが小さいです.そのため,Wikipedia からのオントロジー学習研究が近年,盛んに行われています.しかしながら,Wikipedia はユーザ参加型という性質上,厳密な体系化が行われていないため,Wikipediaからのオントロジー学習には,多くの課題が存在しています.以上より,本プロジェクトでは,日本語Wikipedia における様々なリソース(カテゴリツリー,一覧記事,リダイレクトリンク,Infobox, Infoboxテンプレート)から,大規模かつ汎用的なオントロジーを学習する手法を提案します.
ダウンロード
日本語Wikipediaオントロジー(ver.2010-01-26)の 統計データ
| 種類 |
数 |
| リソース |
597,406 |
| クラス |
14,276 |
| プロパティ |
4,247 |
| インスタンス |
578,883 |
| ステートメント |
3,081,157 |
| ステートメント (RDFS推論) |
4,869,813 |
| is-a関係(rdfs:subClassOf) |
12,109 |
| タイプ(rdf:type) |
580,273 |
日本語Wikipediaオントロジー検索システム
発表論文
- 玉川 奨, 桜井 慎弥, 手島 拓也, 森田 武史, 和泉 憲明, 山口 高平, "日本語Wikipediaからの大規模オントロジー学習", 人工知能学会論文誌 論文特集「2009年度全国大会近未来チャレンジ」 Vol.25 No.5 pp.623-636, (2010.11) (PDF)
- Susumu Tamagawa, Shinya Sakurai, Takuya Tejima, Takeshi Morita, Noriaki Izumi, Takahira Yamaguchi, "Learning a Large Scale of Ontology from Japanese Wikipedia", 2010 IEEE/WIC/ACM International Conference on Web Intelligence pp.279-286, (2010.9)
- 玉川 奨, 桜井 慎弥, 手島 拓也, 森田 武史, 和泉 憲明, 山口 高平, "日本語Wikipediaインフォボックスからのプロパティ自動抽出", 第24回 人工知能学会全国大会論文集 pp.2I3-NFC4-3, (2010.6)
- Takahira Yamaguchi, Takeshi Morita, "Building up a Large Ontology from Wikipedia Japan with Infobox and Category Tree", the 3rd Interdisciplinary Ontology Meeting (InterOntology 10) pp.121--134, (2010.2)
- 森田武史,桜井慎弥,玉川奨,和泉憲明,山口高平:日本語Wikipediaオントロジーの構築および検索システムの実装,情報システム学会,第5回全国大会・研究発表大会(2009.12)
- S.Sakurai, T.Tejima, T.Morita, N.Izumi and T.Yamaguchi: Building up a Large Ontology from Wikipedia Japan with Infobox and Category Tree,4th Asian Semantic Web Conference (ASWC 2009) (2009.12)
- 桜井 慎弥,手島拓也,森田 武史,和泉 憲明,山口 高平: Wikipediaオントロジーに基づくドメインオントロジー構築支援環境の実現と評価, 第23回人工知能学会全国大会, 2G1-NFC5-1(2009.6)
- Takuya Tejima, Shinya Sakurai, Takeshi Morita, Noriaki Izumi, Takahira Yamaguchi, "Domain Ontology Construction with Wikipedia and Folksonomy Tags", PAKM 2008 Workshop on Integrating Taxonomies and Folksonomies for Enhanced Knowledge Navigation (ITFEKN 2008), pp.28--36, (2008.11)
- 手島拓也, 桜井慎弥, 森田武史, 和泉憲明, 山口高平, "WikipediaとFolksonomyタグに基づくドメインオントロジー構築支援環境の実現と評価 ", 人工知能学会第20回セマンティックWebとオントロジー研究会 Wikipediaワークショップ pp.SIG-SWO-A803-03, (2009.1)
- 桜井 慎弥, 手島 拓也, 石川 雅之, 森田 武史, 和泉 憲明, 山口 高平, "汎用オントロジー構築における日本語Wikipediaの適用可能性", 人工知能学会 第18回セマンティックWebとオントロジー研究会 pp.SIG-SWO-A801-06, (2008.7)
- 桜井 慎弥, 手島 拓也, 石川 雅之, 森田 武史, 和泉 憲明, 山口高平, "日本語Wikipediaからの汎用オントロジーの構築と評価", 第22回 人工知能学会全国大会論文集 3F2-3, (2008.6)
- 手島 拓也, 森田 武史, 和泉 憲明, 山口 高平, "日本語WikipediaマイニングとFolksonomyタグに基づく領域オントロジー構築支援", 第21回 人工知能学会全国大会論文集 1D2-5, (2007.6)
プロジェクトメンバー
- 玉川 奨 (慶應義塾大学)
- 関本 有佳(慶應義塾大学)
- 森田 武史(慶應義塾大学)
- 山口 高平(慶應義塾大学)
過去のプロジェクトメンバー
- 桜井 慎弥(慶應義塾大学)
- 手島 拓也(慶應義塾大学)
連絡先
- 玉川 奨 (s_tamagawa@ae.keio.ac.jp)
- 山口 高平 (yamaguti@ae.keio.ac.jp)
関連プロジェクト
リンク