Semantic Role Labeling of Chinese

この文書では中国語の意味役割付与についてまとめます。

コーパス

コロラド大学の Nianwen Xue が中心になってアノテーションしている Chinese Proposition Bank があります。 このコーパスは Penn Chinese Treebank PropBank と同様の情報を付加したもので、動詞の フレームファイルに基づいて意味役割が付与されています。

解析器

名詞化された動詞の解析

中国語における動詞の名詞化は3つの特徴があります。

  1. 動詞と名詞で表記は全く同じ
  2. 名詞化された動詞の項は、その名詞が主辞となっている名詞句 の中にある(述語が支援動詞の場合のみ例外)
  3. 名詞化された動詞の項は、大部分がその名詞より前にある

最初の特徴から動詞に関するフレームを名詞化された動詞にも使う というアイデアが、2つ目の特徴から path および述語の兄弟となっている かという素性を入れるというアイデアが、3つ目の特徴から項が述語の前に あるか後ろにあるかという素性を入れるというアイデアが出てきます。

Nianwen 2006a では最大エントロピー 法に基づく解析器が提案されています。この解析器では、他の意味役割付与 と同じく、まず必須項の候補とそれ以外を識別する二値分類器を作成し、 ついで必須の項と判別されたものに対してどの意味役割であるか判定します。

同論文では動詞と名詞化された動詞を混ぜて学習すると性能が悪くなった ことが報告されていますが、これは動詞と名詞化された動詞では path の情報が大きく異なるためであろう、という分析がなされています。

実験は人手の構文解析結果を使うとf値が86.6、自動構文解析器を使うと f値が51.3となり、構文解析ができれば意味役割付与もできるだろうと 結ばれています。

参考文献


Mamoru Komachi <komachi--at--tmu.ac.jp>
Tokyo Metropolitan University