このエントリーをはてなブックマークに追加
ID 47731
フルテキストURL
タイトル(別表記)
Constrution of Semantic Verb Class Using Graph-Based Co-clustering Approach
著者
竹内 孔一 岡山大学大学院自然科学研究科
抄録
テキスト中に現れる動詞と名詞の格関係を利用して動詞のクラスタリングを行い意味的に類似の集合の構築を目指す.ここでの問題は名詞と動詞はそれぞれ多義であり,かつその語義が観測可能でないことである.本稿ではある名詞の集合と動詞の集合がなすクラスタがある1つのクラスタ (ある潜在的な意味クラスタ) に属すると考え,同時共起クラスタリングを適用する.Web の5億文のデータから獲得された格フレームデータ,ならびに毎日新聞 91 から 98 年を利用して得られた動詞集合について評価することで,本手法により大量のデータがあれば質の良い動詞集合が得られることを明らかにする.
抄録(別表記)
This paper presents our ongoing research for clustering Japanese verbs for constructing Japanese verb lexicon which is founded on the theory of lexical conceptual structure (LCS). The key issue of this research is how to extract a core cluster of Japanese verbs with a highly relating cluster of nouns because not only verbs but also nouns are polysemouns words. In this paper we applied an approach of co-clustering on the basis of graph sctructure into clustering task of verbs and nouns, and present experimental results on Japanese Verb-Case-Noun data from both large Web corpus and Maichini news paper corpus from 1991 to 1998.
発行日
2007-11-19
出版物タイトル
情報処理学会研究報告. 自然言語処理研究会報告
出版物タイトル(別表記)
IPSJ SIG Technical Report
2007巻
113号
出版者
情報処理学会
出版者(別表記)
Information Processing Society of Japan
開始ページ
39
終了ページ
44
ISSN
09196072
NCID
AN10115061
資料タイプ
テクニカルレポート
オフィシャル URL
http://www.bookpark.ne.jp/cm/ipsj/search.asp?flag=6&keyword=IPSJ-NL07182006&mode=PDF
言語
Japanese
著作権者
ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。Notice for the use of this material The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
論文のバージョン
publisher
査読
有り