自然言語処理が学べる研究室

2023年3月をもちましてこちらのページの更新を停止します。ご活用いただき、ありがとうございました。

自然言語処理を学ぶことができる研究室をリストアップします。自然言語処理の研究をしている(= 国内では言語処理学会を主な研究発表の場所としている)教員が2名以上いる大学が対象です(私立大学は早稲田大学と法政大学と豊田工業大学です)。うち、教員が1研究室で3人以上いるのは北大荒木研、東北大乾研、筑波大山本研、東工大奥村研、名大外山研、京大黒橋研、NAIST中村研(ただし中村先生定年のため2022年現在募集停止)、NAIST渡辺研、NAIST荒牧研です。教員が1人だけしかいない研究室と、3人以上いる研究室(特に博士後期課程の在学生が多いところと)は質的にも量的にも違うと思いますので、博士後期課程に進学するつもりの人は、少なくとも1カ所はそれらの研究室を見学したほうがよいでしょう。博士前期課程から入学しやすい(入試が簡単であるという意味ではないですが)のは、東工大とNAISTです。研究室は点在していますが、総研大も学部がないので入りやすいです。

各研究室(大学)の研究力を客観的に知るために、日本所属の言語処理トップカンファレンス論文(2021, 2020, 2019, 2018, 2017, 2016, 2015, 2014)も見るとよいでしょう。これによると、2017年以降日本の大学でトップカンファレンスに通している数が1本より大きいものをノミネートすると、

となり、トップカンファレンスの常連は東大、京大、東北大、東工大、NAIST で、だいたい有力研究室の感覚に合っています(これら全ての大学で、自然言語処理の研究室が2つ以上あります)。これ以外に2回以上ランクインしているのは阪大(5回)、都立大(4回)、名大(3回)、早大(3回)、愛媛大(2回)です。世界的な舞台で活躍したい人は、上記のような大学に進学するとよいです。ちなみに被引用数ランキングも最近作成されているようですので、世界的に注目されている研究をしている大学がどこかというのも分かります。

教員が1名のみの研究室は多くありますので、全部を紹介し切ることはできませんし、そのつもりもありません。抜粋した研究室一覧をどうぞ。

大学院から自然言語処理に専門を変えたい、いわゆる文系出身の方は、あらゆる意味でのサポートが充実している NAIST 次に JAIST を断然お勧めします。それ以外であれば、東工大徳永研、東大相澤研あたりは文系出身の人が複数人いるようです(他にご存知の方がいたら小町までご連絡ください)。理工系出身ではない人が自然言語処理の研究をしたい場合、修士号を持っていても博士後期課程から入学すると基礎知識のある前提で研究をしなければならず、正規の年数での博士号取得が困難であることが予想されるため、もう一度修士から入り直すことを強くお勧めいたします(優秀な方であれば、修士〜博士に5年間かからず、短期終了できるはずですし、日本学術振興会の特別研究員に採用される人も多いと思います)。

また、「理転したい」と思って自然言語処理を専攻する人がいますが、修士の2年間だけの研究では基本的に自然言語処理の専門性があるとは見なされません(学部から続けている人も、難関国際会議の発表経験があったりしないと、専門性があると見なされないと思いますが)。自然言語処理とは関係なく(学部時代にプログラミングを独学していた経験を活かして、ウェブアプリ開発等の)ソフトウェアエンジニア、または(コミュニケーション力を活かして)いわゆる SIer 等で働きたい、というのであれば希望通り就職できる可能性が高いでしょうが、自然言語処理に関する仕事がしたいというのであれば、AI ブームでポストは増えてはいますが、基本的には博士後期課程に進学してから就職活動をすることをお勧めします。

社会人で自然言語処理を学び直したいと考えている人も、基本的には一度退職して NAIST に入ることをお勧めします。東京在住で引っ越すことができず、かつ仕事を辞めることができない(定時に帰ることはできる)場合は、社会人コースの設置されている JAIST に入ることをお勧めします。あるいは、自然言語処理とは少し違いますが、(都立の)産業技術大学院大学にも、データマイニング・機械学習の修士課程があり、夜間・土曜日の通学で修士号が取得できます(ただし、産技大には博士後期課程の設置はありません)。

首都圏で進学できる自然言語処理の学べる大学を探している人へ。大学受験であれば、入学してから気が変わることは往々にしてありますし、研究室に配属される B3/B4 までに状況が変わることもあるので、研究内容にこだわって大学を選ぶことはお勧めしません。どうしても自然言語処理の研究室のある大学に行きたい、という場合、言語自体に興味がある人は総合大学の東大・都立大・筑波大、完全に工学(情報)にしか興味がないのであれば東工大・農工大・電通大をお勧めします。私立で自然言語処理をメインに研究している大学はあまりないのですが、どこか1つ挙げてほしい、と言われたら、早慶上理なら断然早稲田大学(次点は慶応、理科大)、(G)MARCH なら断然法政大学(次点は明治、西東京であれば東京工科大、東東京であれば東京電機大)、中京地区なら断然豊田工大(次点は中京)、関関同立なら同志社(次点は立命館)、産近甲龍なら断然甲南大(次点は龍谷)をお勧めします。

北海道・東北

東北大学

東北には乾研究室があります。推論(含意関係認識)や意味・談話そして対話処理の研究に強みがあります。Twitter に代表されるソーシャルメディアの解析のようなアプリケーションから、機械学習を駆使した情報抽出の研究まで、幅広く手がけています。トップ国際会議に学生が通したり、国内外の学会賞を立て続けに受賞するなど、研究のレベルの高さは胸を張って保証できます。博士後期課程に進学する学生も多いですが、修士で就職する学生も最先端の研究開発をする企業に就職して大活躍しており、研究員の数も圧倒的で、日本の自然言語処理をリードする研究室の一つです。理研AIPの拠点の一つで、研究員もたくさん在籍しています。

また、自然言語処理の研究室として2020年7月に鈴木研究室が誕生しました。NTT研究所にいた鈴木さんも機械学習分野で日本の自然言語処理を牽引するリーダーの1人で、ものすごくクオリティの高い研究をしています。松林研究室も自然言語処理の教育応用の研究をしています。自然言語処理の研究室が3つある国内随一の研究環境です。

東北大学 乾研究室への配属を検討している皆さんへ」は乾研志望の人でなくても、研究室選択の参考になると思いますので、一読することをお勧めします。

北海道大学

北海道には荒木研究室があります。ACL 2003 や言語処理学会2014年のホストを務めるなど、国内外の学会も運営されています。北海学園大の越前谷博さん、小樽商科大の木村泰知さんといった北海道の大学での研究者を輩出しているとともに、青山学院大の内田ゆずさん、福岡大の乙武北斗さんなど、国内の大学にも卒業生がいます。

北見工業大学

北見工大には桝井・プタシンスキ研究室があります。自然言語処理の中でも特にテキストマイニングや情報抽出、そしてそれを活用した観光情報学の研究が盛んです。

首都圏(除く東京)

筑波大学

筑波大学には山本研究室宇津呂研究室があります。山本研は言語モデルとウェブデータ分析、宇津呂研は対訳辞書構築やウェブデータ(Twitter や Wikipedia、ブログといったユーザ参加型のメディア)の分析に一日の長があります。本気で言語モデルの研究をしたいなら、山本研は日本で最先端の研究ができる数少ない大学の一つです。山本研の乾さんは評価極性分析などウェブデータの分析に長年取り組んでらっしゃいますし、特に日本語の言語的な特徴を考慮した研究をしたい人にお勧めします。

※宇津呂研は教員が1名です。

茨城大学

茨城大学には佐々木研究室新納研究室があります。佐々木研究室と新納研究室はいずれも機械学習を用いた自然言語処理の研究を地道に続けてらっしゃいます(深層学習を用いた研究にも積極的に取り組んでらっしゃいます)。

※いずれの研究室も教員1名です。

東京

東京大学

東大には電子情報工学科に鶴岡研究室があります。鶴岡研は基礎レイヤーの仕事がおもしろく、コンピュータゲーム(将棋)と自然言語処理という、人工知能で言う「探索」を用いた独創的な研究をされていて、とても刺激的です。最近は深層学習が盛んです。同じく電子情報工学科で、物理的には東大生産研(駒場)の吉永さん(吉永研究室)は機械学習的な観点からの実用的な自然言語処理の研究を盛んにされています。

一方、コンピュータ科学科の宮尾研究室も自然言語処理の基礎的な研究(構文解析、意味解析、推論)をしたい人にお勧めです。同じくコンピュータ科学科で、物理的には国立情報学研究所(竹橋)の相澤研究室でも言語処理に関する研究をしています。翻訳・論文作成支援など、言語処理を用いたコミュニケーションの支援が盛んです。

また、東大先端研の田中研究室も言語処理の研究をされています。自然言語処理というよりは計算言語学という趣で、言語に関する数理モデルの研究が興味深いです。駒場の言語情報科学の加藤研究室も語彙概念構造などの意味論に基づく研究や情報アクセスに関する研究をしています。2020年には大関研究室ができ、新しいアプローチで言語の謎に迫る研究室で、ほとんどの自然言語処理の研究室が工学的なモチベーションでやっているのに対し、人間らしい言語処理モデルを構築する、という野心的なテーマに挑戦しています。工学的なアプローチやモチベーションに違和感がある人は、これらの研究室の研究を追ってみると楽しいと思います。

2021年からは谷中研究室ができました。論理と深層学習の融合というチャレンジングでおもしろいテーマに取り組んでおり、データセットの構築も含めて丁寧な研究をしており、将来的には日本でも有数の研究室になると思っています。息の長い研究に取り組みたい人はぜひ門を叩いてみてください。

っつり自然言語処理というわけではありませんが、坂田・森研究室は自然言語処理的なアプローチでデータサイエンスに取り組んでいます。

※ほぼ全ての研究室は教員1名です。

東京工業大学

東工大には徳永研究室藤井研究室岡崎研究室奥村・船越研究室があります(徳永研、藤井研、岡崎研は大岡山キャンパス、奥村・船越研はすずかけ台キャンパス)。

徳永研ではコーパスアノテーションを中心としたマルチモーダルな対話処理の研究が盛んです。最近は述語項構造解析のような要素技術にも力を入れています。これまでも博士後期課程の学生はしっかり博士号を取って卒業していっているので、博士号を取得したい人にはよい環境だと思います。

藤井研ではウェブマイニングや情報検索を中心とした研究をされています。

岡崎研究室は機械学習を中心とした自然言語処理全般の研究をしています。最先端の研究に取り組みトップカンファレンスでそれらの成果を発表するだけでなく、オープンソース開発や企業との連携も含め、広く技術を社会に還元しています。2017年にできたばかりですが、日本を代表する研究室になると確信しています。

奥村研ではレビューやブログを対象としたウェブマイニングのような応用から頑健な形態素解析や照応解析のような基礎的な研究までカバーしています。奥村研は大学院からの入学定員が多いので、大学院から自然言語処理の研究をしたい人には広く門戸を開いています。奥村研で修士号を取った人は、国内トップクラスの優れた研究能力を持っていることに太鼓判を押せます。2020年からは船越さんもジョインしました。対話の研究を中心に、実社会で必要な技術を着実に研究していく研究室となっていくと思います。

※徳永研、藤井研は教員1名です。

早稲田大学

早稲田大学にはたくさんの自然言語処理関連の研究室があります。人文系の研究者も様々な学部に点在していて、組織を跨いでつなぐ早稲田言語情報研究所のような組織があります。

河原研究室は2020年にできた研究室ですが、河原さんは基盤技術の研究に圧倒的な強さがあり、国内の学会賞を総なめするほどで、国内トップレベルの研究をされています。早稲田に新しい自然言語処理の伝統ができると思っています。

小林研・小川研は音声寄りの研究が多いですが、新たに発足した AI ロボット研究所も含め早稲田はロボット研究に強く、言語に止まらない研究に取り組めます。

酒井研究室は情報検索メインの研究室ですが、自然言語処理も研究分野に含みます。酒井さんが Microsoft Research Asia にいらしたときから世界トップレベルの独創的な研究をされており、大学に移られてからも精力的に活動をされています。

ルパージュ研究室は北九州にあるキャンパスで、機械翻訳の研究や言語資源構築の研究に長年取り組んでらっしゃいます。

法政大学

数理論理学や理論言語学に興味がある人は金沢研究室があります。機械学習や統計的自然言語処理よりフォーマルな計算言語学をやりたい人にお勧めします(小町は学部生時代金沢先生の意味論に関する講義を受講していて、その後 ACL で再会してびっくりしました)。

深層学習を用いた自然言語処理の研究は彌冨(いやとみ)研究室で手がけています。こちらは金沢研究室とは逆で、言語的な知識を可能な限り使わずに言語処理を行うという人にお勧めします。元気な学生の多い研究室なので、開発が好きな人は楽しく過ごせるでしょう。

また、最近は柴田研究室もできました。深層学習の最先端の手法を用いて言語をはじめとするデータに挑む、意欲的な研究をされています。理論的な研究も含めて深い研究がガチでできる環境の一つなので、今後が非常に楽しみです。

※金沢研、彌冨研、柴田研ともに教員が1名です。

お茶の水女子大学

お茶大には戸次(べっき)研究室小林研究室があります。戸次研究室は組合せ範疇文法や依存型理論、圏論などを用いた数理言語学的アプローチによる研究で世界的に有名で、コンスタントにメジャー国際会議で発表・招待講演をしています(国内外の賞も受賞多数です)。小林研究室はトピックモデルやグラフを用いた自然言語処理の研究をしていましたが、最近は脳情報処理やロボット系の研究が増えてきました。自然言語処理に興味がある女子学生であれば、お茶大はかなり有力かつお勧めな進学先です。女子大学ですが、共同研究生として男子学生も滞在できるようです。

※いずれの研究室も教員1名です。

東京農工大学

農工大には藤田研究室古宮研究室があります。藤田研究室は議論マイニングなど自然言語処理の中でも新しい研究分野に意欲的に取り組んでいます。古宮研究室は2020年にスタートしたばかりですが、分野適応の研究に取り組んでいかれるのだろうと思います。

電気通信大学

電通大には内海研究室があります。内海研究室は認知科学寄りの研究に独自性があります。

自然言語処理とは微妙にフォーカスが異なりますが、稲葉研究室も2019年にでき、対話の先進的な研究をされています。また、坂本研究室はオノマトペを中心とした感性情報処理の研究でメディアへの登場も多数です。

※いずれの研究室も、教員が1名です。

北陸

北陸先端科学技術大学院大学(JAIST)

JAIST には白井研究室グェン研究室サクティ研究室井之上研究室があります。2021-2022年にサクティ研究室と井之上研究室が爆誕し、一気に自然言語処理の研究室を4研究室擁する日本を代表するトップクラスの研究環境になりました。

白井研究室(自然言語処理研究室) はJAIST の中ではもっとも古い研究室です。語義曖昧性解消や新語義発見のように、単語の意味に関する研究に継続的に取り組んでらっしゃいます。日本人学生と留学生がちょうどいいバランスで、留学生も優れた研究成果を挙げています。また、社会人は東京サテライトキャンパスにて指導を受けることができるので、仕事をしながら自然言語処理分野で学び直して修士号を取りたい人には最適な(というか唯一の?)選択肢だと思います。

グェン研究室 (machine learning and natural language understanding lab) は機械学習を用いた自然言語処理の研究をしている研究室です。具体的なタスクは機械翻訳から法令文書処理まで多岐に渡りますが、深層学習を用いた手法も早い時期から積極的に取り入れ、国際的にも評価が高い研究をしています。一方、研究室の学生はほぼ全員が留学生ですので、留学生の人は過ごしやすいでしょう(そもそも JAIST はベトナム出身の留学生が多いです)。また、白井研究室同様、東京サテライトキャンパスでも学生を取っています。

サクティ研究室 (Human-AI Communication, Co-Learning, & Collaborative Intelligence Lab) は音声と言語にまたがる領域の研究をしている研究室です。サクティさんは特に音声翻訳には NICT 時代・NAIST 時代からずっと取り組んで来られ、ニューラル以前から継続して研究している数少ない音声翻訳の研究者で、音声翻訳の研究がしたい人にとってはほぼ唯一無二の研究室です。2021年10月にできたばかりの研究室なので、新しい研究に挑戦したい人は超おすすめの研究室です。

井之上研究室(言語推論研究室)は言語処理の中でも最もチャレンジングな領域である推論に取り組む異色の研究室です。井之上さんは博士後期課程からずっと継続して推論の研究に取り組んでいて、推論エンジンも公開されていたり、ガチで推論の研究をしたい人には太鼓判を押すことができる研究室です。井之上さんは小町の NAIST 時代の後輩(2学年下)ですが、経済学部の出身であり、小町と同じく文系から NAIST に進学して自然言語処理の研究者になる、というキャリアを歩いてらっしゃるので、文系出身の人が門を叩くのにも広く受け入れてくださるでしょうし、今後の研究に大いに期待しています。

豊田工業大学

豊田工大には知能数理研究室があります。深層学習の研究が盛んで、機械学習寄りの研究がしたい人には向いています。トヨタ肝いりの後発の大学ですが、シカゴ大の中にも分校があり、TTIC と呼ばれて機械学習の研究者を中心に世界的に活躍しています。優秀な学生は TTIC に進学するそうです。トップカンファレンスでの発表も堅調で、日本屈指の研究水準を誇っています。学部受験生にとっては有力な選択肢の一つだと思います。

豊橋技術科学大学

豊橋技科大には秋葉研梅村研および土屋研があります。長岡技科大と豊橋技科大は高専からの編入生が多く、学部1年の定員より学部3年の定員のほうが多いので、高専生で自然言語処理の研究をしたい人は、豊橋技科大が有力な候補の一つです。秋葉研は音声検索や質問応答、統計的機械翻訳の研究を継続的にしています。梅村研はウェブマイニングの研究が盛んです。土屋研は2014年に新しくできたばかりですが、日本語の機能表現や言語モデルなど、形態素解析のレイヤーの研究を多く手がけてらっしゃいます。

※秋葉研と土屋研は教員1名です。

名古屋大学

名大には外山研究室佐藤研究室松原研究室そして武田・笹野研究室東中研究室があります。自然言語処理の研究者が多いので、名古屋地区NLPセミナーというセミナーも定期的に開催されています。豊田工業大学も近くにあります。

外山(とやま)研は法令文の言語処理の研究を継続的にされています。また、シソーラスや対訳辞書の(半)自動構築や機械翻訳に関する研究もしています。

佐藤研は文章の難易度推定著者推定に加え、さまざまな文章の生成の課題、そして構文解析のような要素技術の研究に取り組んでいます。

松原研では音声処理に向けた言語処理の基盤的な研究をコツコツとされています。

武田・笹野研究室は談話解析を中心とした形態素解析も含めた要素技術の研究に圧倒的な強さがあります。格フレームの知識獲得など、言語資源の整備を精力的に行なっていて、息の長い研究に取り組んでいます。

東中研は2020年にできた研究室で、NTT 研究所で日本の対話研究を率いてきた東中さんが教授となり、大学でも世界の対話研究をリードしていく存在になっていくのが楽しみです。

※松原研は教員1名です。

近畿圏

奈良先端科学技術大学院大学(NAIST)

NAIST には中村研荒牧研渡辺研、そして連携講座として鳥澤研があります。NAISTは、日本を代表する自然言語処理のメッカですし、日本を代表する機械学習の研究をする双璧の研究室があり、情報抽出の研究も盛んで、大学院から自然言語処理の研究に飛び込みたい人はまず NAIST に行くと間違いありません。

中村研は、自然言語処理の中でも特に音声翻訳の研究をしています。中村研は日本で世界レベルの機械翻訳の研究ができる数少ない研究室なので、自信をもってお勧めできますが、2022年現在もう新規の学生の受け入れはしていないようです(中村先生定年のため)。

また、2015年からはソーシャル・コンピューティング研究室(荒牧研)ができました。ソーシャルメディアのマイニングや医療言語処理で独創的な研究を連発され、国内外の学会賞を多数受賞されています。2020年からは教員2名体制になり、学生数も増えるそうです。博士後期課程に留学生も多く、大所帯になってきました。将来が楽しみな研究室の一つです。毎年年報を発行されているので、研究に興味がある方はまず年報を眺めると良いかと思います。

2019年からは鳥澤研(連携研究室)ができています。基礎から応用まで幅広く手掛け、特に情報抽出では世界トップレベルの研究を量産していて、学生が増えるとどんどん存在感を増して行くでしょう。大規模なデータを使った研究がしたい人は、特に NICT の研究基盤を使うことができるので、とてもよい環境です。連携研究室なので、学生数は少なく見えますが、基幹研究室としては他の研究室にも籍を置くことになりますので、そちらでワイワイ友人もできるのではないかと思います。

2020年には渡辺研ができました。ニューラル機械翻訳以前の統計的機械翻訳の時代から世界を代表する論文を多数発表しており(渡辺太郎さんの論文やチュートリアルは、いつも読んでいて惚れ惚れします)、今後も形態素解析や構文解析のような要素技術の研究も含めて、すぐにトップレベルの研究成果を挙げる研究室になることを確信しています。2022年には特任准教授、准教授、助教がフルメンバー揃いましたが、これ以上のスタッフを日本で揃えるのは不可能ではないかというレベルのスーパースターの方ばかりなので、自然言語処理の研究をしたい学生が NAIST を受けない理由はない、と言うくらいすごいスタッフ陣です。

大阪大学

阪大には、鬼塚研究室(ビッグデータ)駒谷研究室(音声対話システム)などに自然言語処理の研究者が点在しています。対話や翻訳、言語教育支援のように今後大きく伸びていく可能性が高い分野の研究に積極的に取り組んでいるので、10年もすれば関西における自然言語処理の三大拠点の一つとなっていることでしょう。

京都大学

京大には黒橋研森研下平研があります。黒橋研は形態素解析(JUMAN)、構文・意味解析(KNP)のような基盤技術で日本の自然言語処理をリードしています。日本が世界に先駆けて提案した用例翻訳のメッカでもあります。森研では実用的な自然言語処理の研究(頑健性が高い、あるいはトータルで見た場合のコストが少ない)を行なっています。下平研は単語分散表現の数理のように、言語に関する数理的な分析で世界レベルの興味深い研究をされています。どの研究室も大型の研究費を次々に獲得されているので、研究員(ポスドク)の人も多く、国内の研究を引っ張っています。黒橋研は日本を代表する自然言語処理の研究室の一つです。

四国・中国・九州

徳島大学

徳島大には北研究室があります。北研究室はマルチメディア情報検索の研究で有名です(「確率的言語モデル」「情報検索アルゴリズム」という自然言語処理における古典的名著で名前を知っている人も多いでしょう)。北先生はあと数年で定年だそうです

愛媛大学

愛媛大学には二宮研究室があります。二宮さん自身は構文解析の研究で著名な方ですが、深層学習以降は機械翻訳の研究に精力的に取り組まれています。特に文法情報を取り込んだニューラル機械翻訳やマルチモーダル機械翻訳をはじめとし、面白い研究を続けてらっしゃいます。助教で都立大出身の梶原さんも加わり、学生数も20人を超える大所帯になり、勢いもあって今後の発展が楽しみです。

鳥取大学

鳥取大には自然言語処理研究室応用計算知能研究室があります(研究グループ、と言ったほうが適切かも)。機械翻訳から感情分析・情報抽出、統計的自然言語処理まで広くカバーしています。池原先生という機械翻訳に大きな貢献をされた先生がいらしたという経緯もあり、機械翻訳の研究が盛んです。鳥バンクという日英翻訳に関するリソースも公開されています。