Semantic Role Labeling of Chinese
この文書では中国語の意味役割付与についてまとめます。
コーパス
コロラド大学の
Nianwen Xue が中心になってアノテーションしている
Chinese Proposition Bank があります。
このコーパスは
Penn Chinese Treebank に
PropBank と同様の情報を付加したもので、動詞の
フレームファイルに基づいて意味役割が付与されています。
解析器
名詞化された動詞の解析
中国語における動詞の名詞化は3つの特徴があります。
- 動詞と名詞で表記は全く同じ
- 名詞化された動詞の項は、その名詞が主辞となっている名詞句
の中にある(述語が支援動詞の場合のみ例外)
- 名詞化された動詞の項は、大部分がその名詞より前にある
最初の特徴から動詞に関するフレームを名詞化された動詞にも使う
というアイデアが、2つ目の特徴から path および述語の兄弟となっている
かという素性を入れるというアイデアが、3つ目の特徴から項が述語の前に
あるか後ろにあるかという素性を入れるというアイデアが出てきます。
Nianwen 2006a では最大エントロピー
法に基づく解析器が提案されています。この解析器では、他の意味役割付与
と同じく、まず必須項の候補とそれ以外を識別する二値分類器を作成し、
ついで必須の項と判別されたものに対してどの意味役割であるか判定します。
同論文では動詞と名詞化された動詞を混ぜて学習すると性能が悪くなった
ことが報告されていますが、これは動詞と名詞化された動詞では path
の情報が大きく異なるためであろう、という分析がなされています。
実験は人手の構文解析結果を使うとf値が86.6、自動構文解析器を使うと
f値が51.3となり、構文解析ができれば意味役割付与もできるだろうと
結ばれています。
参考文献
-
Nianwen Xue, Semantic Role Labeling of Nominalized
Predicates in Chinese, HLT/NAACL 2006.
-
Nianwen Xue, Annotating the Predicate-Argument Structure
of Chinese Nominalazation, LREC 2006.
- Dan Gildea and Daniel Jurafsky, Automatic labeling for
semantic roles, in Computational Linguistics 28(3), 2002.
- Martha Palmer, Dan Gildea, and Paul Kingsbury, The
Proposition Bank: An Annotated Corpus of Semantic Roles,
in Computational Linguistics 31(1), 2005.
Mamoru Komachi <komachi--at--tmu.ac.jp>
Tokyo Metropolitan University