また、自然言語処理の研究室として2020年7月に鈴木研究室が誕生しました。NTT研究所にいた鈴木さんも機械学習分野で日本の自然言語処理を牽引するリーダーの1人で、ものすごくクオリティの高い研究をしています。松林研究室も自然言語処理の教育応用の研究をしています。自然言語処理の研究室が3つある国内随一の研究環境です。
「東北大学 乾研究室への配属を検討している皆さんへ」は乾研志望の人でなくても、研究室選択の参考になると思いますので、一読することをお勧めします。
北海道大学
北海道には荒木研究室があります。ACL 2003 や言語処理学会2014年のホストを務めるなど、国内外の学会も運営されています。北海学園大の越前谷博さん、小樽商科大の木村泰知さんといった北海道の大学での研究者を輩出しているとともに、青山学院大の内田ゆずさん、福岡大の乙武北斗さんなど、国内の大学にも卒業生がいます。
北見工業大学
北見工大には桝井・プタシンスキ研究室があります。自然言語処理の中でも特にテキストマイニングや情報抽出、そしてそれを活用した観光情報学の研究が盛んです。
首都圏(除く東京)
筑波大学
筑波大学には山本研究室と宇津呂研究室があります。山本研は言語モデルとウェブデータ分析、宇津呂研は対訳辞書構築やウェブデータ(Twitter や Wikipedia、ブログといったユーザ参加型のメディア)の分析に一日の長があります。本気で言語モデルの研究をしたいなら、山本研は日本で最先端の研究ができる数少ない大学の一つです。山本研の乾さんは評価極性分析などウェブデータの分析に長年取り組んでらっしゃいますし、特に日本語の言語的な特徴を考慮した研究をしたい人にお勧めします。
※宇津呂研は教員が1名です。
茨城大学
茨城大学には佐々木研究室と新納研究室があります。佐々木研究室と新納研究室はいずれも機械学習を用いた自然言語処理の研究を地道に続けてらっしゃいます(深層学習を用いた研究にも積極的に取り組んでらっしゃいます)。
※いずれの研究室も教員1名です。
東京
東京工業大学
東工大には徳永研究室、藤井研究室、岡崎研究室と奥村・高村・船越研究室があります(徳永研、藤井研、岡崎研は大岡山キャンパス、奥村・高村・船越研はすずかけ台キャンパス)。
徳永研ではコーパスアノテーションを中心としたマルチモーダルな対話処理の研究が盛んです。最近は述語項構造解析のような要素技術にも力を入れています。これまでも博士後期課程の学生はしっかり博士号を取って卒業していっているので、博士号を取得したい人にはよい環境だと思います。
藤井研ではウェブマイニングや情報検索を中心とした研究をされています。
岡崎研究室は機械学習を中心とした自然言語処理全般の研究をしています。最先端の研究に取り組みトップカンファレンスでそれらの成果を発表するだけでなく、オープンソース開発や企業との連携も含め、広く技術を社会に還元しています。2017年にできたばかりですが、日本を代表する研究室になると確信しています。
奥村研ではレビューやブログを対象としたウェブマイニングのような応用から頑健な形態素解析や照応解析のような基礎的な研究までカバーしています。高村さんが研究活動の主軸を産総研に移しました(本務が産総研で、クロスアポイントメント制度を利用して20%大学の仕事)が、奥村研は大学院からの入学定員が多いので、大学院から自然言語処理の研究をしたい人には広く門戸を開いています。奥村研で修士号を取った人は、国内トップクラスの優れた研究能力を持っていることに太鼓判を押せます(ただし、修士号が2年間で取れるとは限りません。本人の能力と適性に応じて、もっとかかる人もいます。自分も学部時代は3年留年して7年間学部生をしていたので、しっかり学ぶことは大事だと思っています。)。博士後期課程の学生数が多いですが、博士号が取れるかどうかは別問題(企業の研究所にいて仕事として論文が書けるかどうか等に依存)なので、奥村研出身の人に確認することをお勧めします(博士号を取得できた人はとても優秀であることは間違いありません)。2020年からは船越さんもジョインしました。対話の研究を中心に、実社会で必要な技術を着実に研究していく研究室となっていくと思います。
※徳永研、藤井研は教員1名です。
東京大学
東大には電子情報工学科に鶴岡研究室があります。鶴岡研は基礎レイヤーの仕事がおもしろく、コンピュータゲーム(将棋)と自然言語処理という、人工知能で言う「探索」を用いた独創的な研究をされていて、とても刺激的です。最近は深層学習が盛んです。同じく電子情報工学科で、物理的には東大生産研(駒場)の吉永さん(吉永研究室)は機械学習的な観点からの実用的な自然言語処理の研究を盛んにされています。
一方、コンピュータ科学科の宮尾研究室も自然言語処理の基礎的な研究(構文解析、意味解析、推論)をしたい人にお勧めです。同じくコンピュータ科学科で、物理的には国立情報学研究所(竹橋)の相澤研究室でも言語処理に関する研究をしています。翻訳・論文作成支援など、言語処理を用いたコミュニケーションの支援が盛んです。
また、東大先端研の田中研究室も言語処理の研究をされています。自然言語処理というよりは計算言語学という趣で、言語に関する数理モデルの研究が興味深いです。駒場の言語情報科学の加藤研究室も語彙概念構造などの意味論に基づく研究や情報アクセスに関する研究をしています。
最近は創造情報学の中山研究室も自然言語処理の研究に積極的に取り組んでおり、画像と言語や自然言語処理のための深層学習でおもしろい研究を連発しています。数年後には押しも押されぬ自然言語処理の新進気鋭の研究室となっていることでしょう。研究室紹介のメッセージは、中山研に限らず深層学習を研究テーマにしたい人に非常に参考になるメッセージが書かれているので、ご一読ください。
がっつり自然言語処理というわけではありませんが、坂田・森研究室は自然言語処理的なアプローチでデータサイエンスに取り組んでいます。
※ほぼ全ての研究室は教員1名です。
お茶の水女子大学
お茶大には
戸次(べっき)研究室と
小林研究室があります。戸次研究室は組合せ範疇文法や依存型理論、圏論などを用いた数理言語学的アプローチによる研究で世界的に有名で、コンスタントにメジャー国際会議で発表・招待講演をしています(国内外の賞も受賞多数です)。小林研究室はトピックモデルやグラフを用いた自然言語処理の研究をしていましたが、最近は脳情報処理やロボット系の研究が増えてきました。自然言語処理に興味がある女子学生であれば、お茶大はかなり有力かつお勧めな進学先です。女子大学ですが、共同研究生として男子学生も滞在できるようです。
※いずれの研究室も教員1名です。
電気通信大学
電通大には内海研究室と松吉研究室があります。内海研究室は認知科学寄りの研究に独自性があります。松吉研究室は2016年にできた新しい研究室ですが、言語学的な分析を丁寧に行う言語処理で定評があります(国内学会の賞を多数受賞されています)。言語資源の作成に興味がある人は、松吉研究室をお勧めいたします。
自然言語処理とは微妙にフォーカスが異なりますが、稲葉研究室も2019年にでき、対話の先進的な研究をされています。また、坂本研究室はオノマトペを中心とした感性情報処理の研究でメディアへの登場も多数です。
※いずれの研究室も、教員が1名です。
早稲田大学
早稲田大学にはたくさんの自然言語処理関連の研究室があります。人文系の研究者も様々な学部に点在していて、組織を跨いでつなぐ
早稲田言語情報研究所のような組織があります。
河原研究室は2020年にできた研究室ですが、河原さんは基盤技術の研究に圧倒的な強さがあり、国内の学会賞を総なめするほどで、国内トップレベルの研究をされています。早稲田に新しい自然言語処理の伝統ができると思っています。
酒井研究室は情報検索メインの研究室ですが、自然言語処理も研究分野に含みます。酒井さんが Microsoft Research Asia にいらしたときから世界トップレベルの独創的な研究をされており、大学に移られてからも精力的に活動をされています。
ルパージュ研究室は北九州にあるキャンパスで、機械翻訳の研究や言語資源構築の研究に長年取り組んでらっしゃいます。
法政大学
数理論理学や理論言語学に興味がある人は金沢研究室があります。機械学習や統計的自然言語処理よりフォーマルな計算言語学をやりたい人にお勧めします(小町は学部生時代金沢先生の意味論に関する講義を受講していて、その後 ACL で再会してびっくりしました)。
深層学習を用いた自然言語処理の研究は彌冨(いやとみ)研究室で手がけています。こちらは金沢研究室とは逆で、言語的な知識を可能な限り使わずに言語処理を行うという人にお勧めします。元気な学生の多い研究室なので、開発が好きな人は楽しく過ごせるでしょう。
※金沢研、彌冨研ともに教員が1名です。
中部
豊田工業大学
豊田工大には知能数理研究室があります。深層学習の研究が盛んで、機械学習寄りの研究がしたい人には向いています。トヨタ肝いりの後発の大学ですが、シカゴ大の中にも分校があり、TTIC
と呼ばれて機械学習の研究者を中心に世界的に活躍しています。優秀な学生は TTIC
に進学するそうです。トップカンファレンスでの発表も堅調で、日本屈指の研究水準を誇っています。学部受験生にとっては有力な選択肢の一つだと思います。
豊橋技術科学大学
豊橋技科大には秋葉研と梅村研および土屋研があります。長岡技科大と豊橋技科大は高専からの編入生が多く、学部1年の定員より学部3年の定員のほうが多いので、高専生で自然言語処理の研究をしたい人は、豊橋技科大が有力な候補の一つです。秋葉研は音声検索や質問応答、統計的機械翻訳の研究を継続的にしています。梅村研はウェブマイニングの研究が盛んです。土屋研は2014年に新しくできたばかりですが、日本語の機能表現や言語モデルなど、形態素解析のレイヤーの研究を多く手がけてらっしゃいます。
※秋葉研と土屋研は教員1名です。
名古屋大学
名大には外山研究室と佐藤研究室、松原研究室そして武田・笹野研究室と東中研究室があります。自然言語処理の研究者が多いので、名古屋地区NLPセミナーというセミナーも定期的に開催されています。豊田工業大学も近くにあります。
外山(とやま)研は法令文の言語処理の研究を継続的にされています。また、シソーラスや対訳辞書の(半)自動構築や機械翻訳に関する研究もしています。
佐藤研は文章の難易度推定著者推定に加え、さまざまな文章の生成の課題、そして構文解析のような要素技術の研究に取り組んでいます。
松原研では音声処理に向けた言語処理の基盤的な研究をコツコツとされています。
武田・笹野研究室は談話解析を中心とした形態素解析も含めた要素技術の研究に圧倒的な強さがあります。
東中研は2020年にできた研究室で、NTT 研究所で日本の対話研究を率いてきた東中さんが教授となり、大学でも世界の対話研究をリードしていく存在になっていくのが楽しみです。
※松原研は教員1名です。
近畿圏
奈良先端科学技術大学院大学(NAIST)
NAIST には中村研と荒牧研と渡辺研、そして連携講座として鳥澤研があります。NAISTは、日本を代表する自然言語処理のメッカですし、日本を代表する機械学習の研究をする双璧の研究室があり、情報抽出の研究も盛んで、大学院から自然言語処理の研究に飛び込みたい人はまず NAIST に行くと間違いありません。
中村研は、自然言語処理の中でも特に音声翻訳の研究をしています。中村研は日本で世界レベルの(統計的)機械翻訳の研究ができる数少ない研究室なので、自信をもってお勧めできます(ただし、ここ数年は入試の競争率が極めて高いようです)。
また、2015年からはソーシャル・コンピューティング研究室(荒牧研)ができました。ソーシャルメディアのマイニングや医療言語処理で独創的な研究を連発され、国内外の学会賞を多数受賞されています。2020年からは教員2名体制になり、学生数も増えるそうです。将来が楽しみな研究室の一つです。
2019年からは鳥澤研(連携研究室)ができています。基礎から応用まで幅広く手掛け、特に情報抽出では世界トップレベルの研究を量産していて、学生が増えるとどんどん存在感を増して行くでしょう。大規模なデータを使った研究がしたい人は、特に NICT の研究基盤を使うことができるので、とてもよい環境です。
2020年には渡辺研ができました。ニューラル機械翻訳以前の統計的機械翻訳の時代から世界を代表する論文を多数発表しており(渡辺太郎さんの論文やチュートリアルは、いつも読んでいて惚れ惚れします)、今後も形態素解析や構文解析のような要素技術の研究も含めて、すぐにトップレベルの研究成果を挙げる研究室になることを確信しています。
大阪大学
阪大には、鬼塚研究室(ビッグデータ)駒谷研究室(音声対話システム)などに自然言語処理の研究者が点在しています。対話や翻訳、言語教育支援のように今後大きく伸びていく可能性が高い分野の研究に積極的に取り組んでいるので、10年もすれば関西における自然言語処理の三大拠点の一つとなっていることでしょう。
京都大学
京大には黒橋研と森研があります。黒橋研は形態素解析(JUMAN)、構文・意味解析(KNP)のような基盤技術で日本の自然言語処理をリードしています。日本が世界に先駆けて提案した用例翻訳のメッカでもあります。森研では実用的な自然言語処理の研究(頑健性が高い、あるいはトータルで見た場合のコストが少ない)を行なっています。どの研究室も大型の研究費を次々に獲得されているので、研究員(ポスドク)の人も多く、国内の研究を引っ張っています。黒橋研は日本を代表する自然言語処理の研究室の一つです。
四国・中国・九州
徳島大学
徳島大には北研究室があります。北研究室はマルチメディア情報検索の研究で有名です(「確率的言語モデル」「情報検索アルゴリズム」という自然言語処理における古典的名著で名前を知っている人も多いでしょう)。
鳥取大学
鳥取大には自然言語処理研究室と応用計算知能研究室があります(研究グループ、と言ったほうが適切かも)。機械翻訳から感情分析・情報抽出、統計的自然言語処理まで広くカバーしています。池原先生という機械翻訳に大きな貢献をされた先生がいらしたという経緯もあり、機械翻訳の研究が盛んです。鳥バンクという日英翻訳に関するリソースも公開されています。