研究テーマ
小町研究室では2021年現在、以下のような研究テーマに取り組んでいます。ただし、これらの研究テーマに限られません。最近どのような研究に取り組んでいるのかは学位論文テーマや発表一覧を見てください。
小町研では自分のやりたい研究をやることが奨励されます。教員の仕事は、学生のやりたいことを「研究」というフォーマットに乗せることだと考えています。研究室に配属になってから半年は、大学院生がメンターとしてつき、メンターが提示する研究テーマの中から一つ選んで研究に取り組みます(サーベイ・実験を行い、自然言語処理の若手シンポジウムでポスター発表します)。その後、そのテーマをしばらく続けたい人は継続し、変えたい人は変え、いずれせよ1年目の終わりには言語処理学会年次大会で発表し、良好な結果が得られたら ACL(自然言語処理のトップカンファレンス)に投稿します。
新入生のうち、最初の半年のテーマを1年続ける人は約半分、ACL に投稿するのも約半分で、最初のテーマを続けたかどうかと ACL に投稿できるような結果が得られたかには相関はありません。また、2年目はいずれにせよ自分で考えた研究テーマに取り組んでもらいます(2年目もしくは3年目にはメンターとして後輩の指導に当たってもらいます)。新しいテーマに臆せず挑戦してくれる人を歓迎します。
自然言語処理の基礎
形態素解析や固有表現抽出、構文解析、述語項構造解析や意味役割付与のような意味解析技術の研究を通じて、人間の使う言語の理解を目指しています。また、時代によって変わる単語の意味の変遷についても研究しています。
日本語述語項構造解析におけるマルチタスク学習 (NAACL 2019)
ニューラル日中英構文解析 (SNL 2019)
ニューラル日本語単語分割 (PACLIC 2018)
インドネシア語の固有表現認識 (AACL-IJCNLP 2020)
自然言語処理の応用
自然言語処理技術を用いて日本語学習者・英語学習者の支援を行なう研究に強みがあり、最近は中国語学習者の支援にも着手しました。Lang-8 や HiNative といったオンライン言語学習サイトからの知識マイニングに取り組んでいます。
中国語の文法誤り訂正 (AACL-IJCNLP 2020)
文法誤り訂正における転移学習 (COLING 2020)
文法誤り訂正における多様な出力の生成 (COLING 2020)
文法誤り訂正の評価 (COLING 2020)
機械翻訳
2015年前後からニューラル機械翻訳の研究に取り組んでいます。現在は、画像の情報を用いて翻訳を行うマルチモーダル機械翻訳の研究グループが最も大きいグループです。
マルチモーダル機械翻訳 (WMT 2020; MT Summit 2019)
サブ文字(部首)レベルでの日中ニューラル機械翻訳 (WMT 2018; ACM TALLIP 2021)
低リソースニューラル機械翻訳 (ACM TALLIP 2019)
文書単位での機械翻訳 (PACLING 2019)
機械翻訳の自動評価・品質推定 (WMT 2018; WMT 2019; WMT 2020)