このエントリーをはてなブックマークに追加
ID 47729
フルテキストURL
タイトル(別表記)
An evaluation of document set similarity based on morpheme occurence patterns
著者
小山 照夫 国立情報学研究所
竹内 孔一 岡山大学大学院自然科学研究科
抄録
類似したテーマを類似した論述構造で扱う文書を集めた文書集合同士では、共通 した形態素利用パタンが出現すると予想される。一方で、形態素出現傾向の相違は、文書集合の間で扱われるテーマあるいは論述構造の相違を示すものと考えられる。本研究では、異なる学会の研究抄録を集めた文書集合について、形態素出現傾向が集合間の類似性や相違を評価する指標として有効であることを確認するとともに、どの形態素が文書集合間の類似性ないしは相違性に寄与しているかを評価する方法について発表する。
抄録(別表記)
We can assume that two different document sets may show similar morpheme occurrence patterns, if the sets both discuss about similar topics with similar discussion manners. In this paper, the authors show the occurrence patterns of morphemes really indicates the similarity of the sets. The authors also show the difference of the patterns in both sets indicate the difference of topics or discussion manner between the sets. The authors also show how to find key morphemes that indicate the similarity or difference of the sets.
発行日
2008-11-19
出版物タイトル
情報処理学会研究報告. 自然言語処理研究会報告
出版物タイトル(別表記)
IPSJ SIG Technical Report
2008巻
113号
出版者
情報処理学会
出版者(別表記)
Information Processing Society of Japan
開始ページ
51
終了ページ
56
ISSN
09196072
NCID
AN10115061
資料タイプ
テクニカルレポート
オフィシャル URL
http://www.bookpark.ne.jp/cm/ipsj/search.asp?flag=6&keyword=IPSJ-NL08188008&mode=PDF
言語
Japanese
著作権者
ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。Notice for the use of this material The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
論文のバージョン
publisher
査読
有り