2020

自然言語処理を学ぶことができる研究室をリストアップします。自然言語処理の研究をしている教員が2名以上いる大学が対象です(私立大学は早稲田大学と法政大学と豊田工業大学です)。うち、教員が1研究室で3人以上いるのは北大荒木研、東北大乾研、筑波大山本研、東工大奥村研、名大外山研、NAIST中村研です。教員が1人だけしかいない研究室と、3人以上いる研究室(特に博士後期課程の在学生が多いところと)は質的にも量的にも違うと思いますので、博士後期課程に進学するつもりの人は、少なくとも1カ所はそれらの研究室を見学したほうがよいでしょう。博士前期課程から入学しやすい(入試が簡単であるという意味ではないですが)のは、東工大とNAISTです。研究室は点在していますが、総研大も学部がないので入りやすいです。

各研究室(大学)の研究力を客観的に知るために、日本所属の言語処理トップカンファレンス論文(2020, 2019, 2018, 2017, 2016, 2015, 2014)も見るとよいでしょう。これによると、2016年以降日本の大学でトップカンファレンスに通している数が1本より大きいものをノミネートすると、

    • 2020年: 東大 = 京大 = 東工大 > 東北大 >> NAIST = 都立大 >> 早大 >> 阪大 > 愛媛大 = 名大 = お茶大 = 山梨大 = 電通大

    • 2019年: 東大 >> NAIST > 京大 = 東北大 > 首都大(都立大) > 東工大 > 阪大 >> 名大 = 農工大

    • 2018年: 東大 >> 京大 > 東北大 = NAIST >> 東工大 > 阪大 > 首都大(都立大) > 豊田工大 = 早大

    • 2017年: 東大 >> NAIST >> 東工大 > 京大 > 阪大 > 東北大 > JAIST

    • 2016年: NAIST > 京大 > 東北大 >> 東工大 > 東大 > 阪大 = 早大 = 首都大(都立大) = 豊田工大 = お茶大

となり、トップカンファレンスの常連は東大、京大、NAIST、東北大、東工大で、だいたい有力研究室の感覚に合っています(これら全ての大学で、自然言語処理の研究室が2つ以上あります)。「トップ5」以外に2回以上ランクインしているのは阪大(5回)、都立大(4回)、早大(3回)、豊田工大(2回)、名大(2回)、お茶大(2回)です。世界的な舞台で活躍したい人は、上記のような大学に進学するとよいです。

自然言語処理は伝統的に西日本が強い(古くは九州大学、そして京大、NAISTあたりで盛んだった)のですが、岡崎さんが東北大から東工大(大岡山)に、船越さんが HRI から東工大(すずかけ台)に、宮尾さんが NII から東大に移られたので、今後はさらに東大・東工大からの発表論文数が増えることでしょう。2020年以降を予想すると、東大・京大・NAIST・東北大・東工大が年ごとに入れ替わり、都立大・阪大・早大・豊田工大・名大がそれに続く、という感じになるのではと思います。

教員が1名のみの研究室は多くありますので、全部を紹介し切ることはできませんし、そのつもりもありません。抜粋した研究室一覧をどうぞ。

    • 大学受験生の人へ: 迷ったら総合大学に進学しましょう。いろいろ勉強して他のことがしたくなることもたくさんあります。総合大学の方が、そういう機会がたくさんあります。NAIST/JAIST/東工大(すずかけ台) のように大学院から来る学生が多い研究室もありますので、学部選択の段階でそこまで絞り込む必要はありません。(また、行きたい研究室をピンポイントに念頭に置いて進学しても、人気研究室でものすごく成績がよくないと入れなかったり、あるいは教員が定年または異動して研究室配属の時期にいなくなっていることもあります)

    • 高専からの編入生の人へ: なんらかの形で自然言語処理の研究がしたいなら、豊橋技科大をお勧めします。あと、専攻科に進学して大学院受験をする人もおり、自然言語処理・機械学習分野で活躍する高専出身生は専攻科出身の人が(編入の人より)多い気がするので、無理に3年次編入しなくてもいいと思います(ちなみに、のちに自然言語処理で活躍する人も、専攻科で自然言語処理の研究をしているとは限りません)。ただし、このところ AI ブームで自然言語処理の大学院入試は厳しいので、行きたい大学院(研究室)があるなら、大学院進学が内部生扱いになるよう、3年次編入した方がいいでしょう(たとえば都立大だと編入後の GPA で研究室配属されるので、厳し目の成績の多い教養科目がある下から上がってきた学生と比較して、編入生は有利です)。

    • 大学院受験生の人へ: 自然言語処理をしたい、というのは絞り込めているでしょうが、研究テーマは自然言語処理を詳しく勉強したら気が変わることもよくあります(だいたい1/3が入学時にやりたいことを修論にし、2/3は変えています)。この研究テーマだからここでないと、という場合もありますが、それよりは実際に見学したりブログ、Twitter などで教員や在学生の人となりを見たりして、自分に合っている雰囲気かどうかで選んだ方がいいです。最近は大学院入試が過熱気味なので、優れた研究環境の研究室はどこも選抜が厳しいと思ってください(そのため、研究環境というよりは相性で選んだ方が、希望が叶えられる可能性が高いです。)。

    • 留学生の人へ: 大学院から自然言語処理の研究がしたいなら、NAIST/JAIST/総研大が(少なくとも留学生にとっては)いい選択肢です。日本人は日本語ができるので、地方にあるいい研究室に進学することも検討できますが、留学生の人は地方の大学だと周りに留学生がほとんどいないことがあるので、相当優秀な人(日本語がものすごくできて日本人と一緒に研究できるか、あるいは日本人と一緒に研究しなくても自分でどんどん研究できる人)でないと自然言語処理の研究をすることはお勧めしません。NAIST/JAIST/総研大は留学生が多く、かつこれらの大学に入る日本人も英語でのコミュニケーションに問題がない学生が多いです。

大学院から自然言語処理に専門を変えたい、いわゆる文系出身の方は、あらゆる意味でのサポートが充実している NAIST を断然お勧めします。それ以外であれば、東工大徳永研、東大相澤研あたりは文系出身の人が複数人いるようです(他にご存知の方がいたら小町までご連絡ください)。理工系出身ではない人が自然言語処理の研究をしたい場合、修士号を持っていても博士後期課程から入学すると基礎知識のある前提で研究をしなければならず、正規の年数での博士号取得が困難であることが予想されるため、もう一度修士から入り直すことを強くお勧めいたします(優秀な方であれば、修士〜博士に5年間かからず、短期終了できるはずですし、日本学術振興会の特別研究員に採用される人も多いと思います)。

また、「理転したい」と思って自然言語処理を専攻する人がいますが、修士の2年間だけの研究では基本的に自然言語処理の専門性があるとは見なされません(学部から続けている人も、難関国際会議の発表経験があったりしないと、専門性があると見なされないと思いますが)。自然言語処理とは関係なく(学部時代にプログラミングを独学していた経験を活かして、ウェブアプリ開発等の)ソフトウェアエンジニア、または(コミュニケーション力を活かして)いわゆる SIer 等で働きたい、というのであれば希望通り就職できる可能性が高いでしょうが、自然言語処理に関する仕事がしたいというのであれば、AI ブームでポストは増えてはいますが、基本的には博士後期課程に進学してから就職活動をすることをお勧めします。

社会人で自然言語処理を学び直したいと考えている人も、基本的には一度退職して NAIST に入ることをお勧めします。東京在住で引っ越すことができず、かつ仕事を辞めることができない(定時に帰ることはできる)場合は、社会人コースの設置されている JAIST に入ることをお勧めします。あるいは、自然言語処理とは少し違いますが、(都立の)産業技術大学院大学にも、データマイニング・機械学習の修士課程があり、夜間・土曜日の通学で修士号が取得できます(ただし、産技大には博士後期課程の設置はありません)。

首都圏で進学できる自然言語処理の学べる大学を探している人へ。大学受験であれば、入学してから気が変わることは往々にしてありますし、研究室に配属される B3/B4 までに状況が変わることもあるので、研究内容にこだわって大学を選ぶことはお勧めしません。どうしても自然言語処理の研究室のある大学に行きたい、という場合、言語自体に興味がある人は総合大学の東大・都立大・筑波大、完全に工学(情報)にしか興味がないのであれば東工大・農工大・電通大をお勧めします。私立で自然言語処理をメインに研究している大学はあまりないのですが、どこか1つ挙げてほしい、と言われたら、早慶上理なら断然早稲田大学(次点は慶応、理科大もあり)、(G)MARCH なら断然法政大学(次点は明治、西東京であれば東京工科大、東東京であれば東京電機大)、中京地区なら断然豊田工大(次点は中京)、関関同立なら同志社・立命館、産近甲龍なら断然甲南大(次点は龍谷)をお勧めします。

北海道・東北

東北大学

東北には乾研究室があります。推論(含意関係認識)や意味・談話そして対話処理の研究に強みがあります。Twitter に代表されるソーシャルメディアの解析のようなアプリケーションから、機械学習を駆使した情報抽出の研究まで、幅広く手がけています。トップ国際会議に学生が通したり、国内外の学会賞を立て続けに受賞するなど、研究のレベルの高さは胸を張って保証できます。博士後期課程に進学する学生も多いですが、修士で就職する学生も最先端の研究開発をする企業に就職して大活躍しており、研究員の数も圧倒的で、日本の自然言語処理をリードする研究室の一つです。理研AIPの拠点の一つで、研究員もたくさん在籍しています。

また、自然言語処理の研究室として2020年7月に鈴木研究室が誕生しました。NTT研究所にいた鈴木さんも機械学習分野で日本の自然言語処理を牽引するリーダーの1人で、ものすごくクオリティの高い研究をしています。松林研究室も自然言語処理の教育応用の研究をしています。自然言語処理の研究室が3つある国内随一の研究環境です。

東北大学 乾研究室への配属を検討している皆さんへ」は乾研志望の人でなくても、研究室選択の参考になると思いますので、一読することをお勧めします。

北海道大学

北海道には荒木研究室があります。ACL 2003 や言語処理学会2014年のホストを務めるなど、国内外の学会も運営されています。北海学園大の越前谷博さん、小樽商科大の木村泰知さんといった北海道の大学での研究者を輩出しているとともに、青山学院大の内田ゆずさん、福岡大の乙武北斗さんなど、国内の大学にも卒業生がいます。

北見工業大学

北見工大には桝井・プタシンスキ研究室があります。自然言語処理の中でも特にテキストマイニングや情報抽出、そしてそれを活用した観光情報学の研究が盛んです。

首都圏(除く東京)

筑波大学

筑波大学には山本研究室宇津呂研究室があります。山本研は言語モデルとウェブデータ分析、宇津呂研は対訳辞書構築やウェブデータ(Twitter や Wikipedia、ブログといったユーザ参加型のメディア)の分析に一日の長があります。本気で言語モデルの研究をしたいなら、山本研は日本で最先端の研究ができる数少ない大学の一つです。山本研の乾さんは評価極性分析などウェブデータの分析に長年取り組んでらっしゃいますし、特に日本語の言語的な特徴を考慮した研究をしたい人にお勧めします。

※宇津呂研は教員が1名です。

茨城大学

茨城大学には佐々木研究室新納研究室があります。佐々木研究室と新納研究室はいずれも機械学習を用いた自然言語処理の研究を地道に続けてらっしゃいます(深層学習を用いた研究にも積極的に取り組んでらっしゃいます)。

※いずれの研究室も教員1名です。

東京

東京工業大学

東工大には徳永研究室藤井研究室岡崎研究室奥村・高村・船越研究室があります(徳永研、藤井研、岡崎研は大岡山キャンパス、奥村・高村・船越研はすずかけ台キャンパス)。

徳永研ではコーパスアノテーションを中心としたマルチモーダルな対話処理の研究が盛んです。最近は述語項構造解析のような要素技術にも力を入れています。これまでも博士後期課程の学生はしっかり博士号を取って卒業していっているので、博士号を取得したい人にはよい環境だと思います。

藤井研ではウェブマイニングや情報検索を中心とした研究をされています。

岡崎研究室は機械学習を中心とした自然言語処理全般の研究をしています。最先端の研究に取り組みトップカンファレンスでそれらの成果を発表するだけでなく、オープンソース開発や企業との連携も含め、広く技術を社会に還元しています。2017年にできたばかりですが、日本を代表する研究室になると確信しています。

奥村研ではレビューやブログを対象としたウェブマイニングのような応用から頑健な形態素解析や照応解析のような基礎的な研究までカバーしています。高村さんが研究活動の主軸を産総研に移しました(本務が産総研で、クロスアポイントメント制度を利用して20%大学の仕事)が、奥村研は大学院からの入学定員が多いので、大学院から自然言語処理の研究をしたい人には広く門戸を開いています。奥村研で修士号を取った人は、国内トップクラスの優れた研究能力を持っていることに太鼓判を押せます(ただし、修士号が2年間で取れるとは限りません。本人の能力と適性に応じて、もっとかかる人もいます。自分も学部時代は3年留年して7年間学部生をしていたので、しっかり学ぶことは大事だと思っています。)。博士後期課程の学生数が多いですが、博士号が取れるかどうかは別問題(企業の研究所にいて仕事として論文が書けるかどうか等に依存)なので、奥村研出身の人に確認することをお勧めします(博士号を取得できた人はとても優秀であることは間違いありません)。2020年からは船越さんもジョインしました。対話の研究を中心に、実社会で必要な技術を着実に研究していく研究室となっていくと思います。

※徳永研、藤井研は教員1名です。

東京大学

東大には電子情報工学科に鶴岡研究室があります。鶴岡研は基礎レイヤーの仕事がおもしろく、コンピュータゲーム(将棋)と自然言語処理という、人工知能で言う「探索」を用いた独創的な研究をされていて、とても刺激的です。最近は深層学習が盛んです。同じく電子情報工学科で、物理的には東大生産研(駒場)の吉永さん(吉永研究室)は機械学習的な観点からの実用的な自然言語処理の研究を盛んにされています。

一方、コンピュータ科学科の宮尾研究室も自然言語処理の基礎的な研究(構文解析、意味解析、推論)をしたい人にお勧めです。同じくコンピュータ科学科で、物理的には国立情報学研究所(竹橋)の相澤研究室でも言語処理に関する研究をしています。翻訳・論文作成支援など、言語処理を用いたコミュニケーションの支援が盛んです。

また、東大先端研の田中研究室も言語処理の研究をされています。自然言語処理というよりは計算言語学という趣で、言語に関する数理モデルの研究が興味深いです。駒場の言語情報科学の加藤研究室も語彙概念構造などの意味論に基づく研究や情報アクセスに関する研究をしています。

最近は創造情報学の中山研究室も自然言語処理の研究に積極的に取り組んでおり、画像と言語や自然言語処理のための深層学習でおもしろい研究を連発しています。数年後には押しも押されぬ自然言語処理の新進気鋭の研究室となっていることでしょう。研究室紹介のメッセージは、中山研に限らず深層学習を研究テーマにしたい人に非常に参考になるメッセージが書かれているので、ご一読ください。

がっつり自然言語処理というわけではありませんが、坂田・森研究室は自然言語処理的なアプローチでデータサイエンスに取り組んでいます。

※ほぼ全ての研究室は教員1名です。

お茶の水女子大学

お茶大には戸次(べっき)研究室小林研究室があります。戸次研究室は組合せ範疇文法や依存型理論、圏論などを用いた数理言語学的アプローチによる研究で世界的に有名で、コンスタントにメジャー国際会議で発表・招待講演をしています(国内外の賞も受賞多数です)。小林研究室はトピックモデルやグラフを用いた自然言語処理の研究をしていましたが、最近は脳情報処理やロボット系の研究が増えてきました。自然言語処理に興味がある女子学生であれば、お茶大はかなり有力かつお勧めな進学先です。女子大学ですが、共同研究生として男子学生も滞在できるようです。

※いずれの研究室も教員1名です。

電気通信大学

電通大には内海研究室松吉研究室があります。内海研究室は認知科学寄りの研究に独自性があります。松吉研究室は2016年にできた新しい研究室ですが、言語学的な分析を丁寧に行う言語処理で定評があります(国内学会の賞を多数受賞されています)。言語資源の作成に興味がある人は、松吉研究室をお勧めいたします。

自然言語処理とは微妙にフォーカスが異なりますが、稲葉研究室も2019年にでき、対話の先進的な研究をされています。また、坂本研究室はオノマトペを中心とした感性情報処理の研究でメディアへの登場も多数です。

※いずれの研究室も、教員が1名です。

早稲田大学

早稲田大学にはたくさんの自然言語処理関連の研究室があります。人文系の研究者も様々な学部に点在していて、組織を跨いでつなぐ早稲田言語情報研究所のような組織があります。

河原研究室は2020年にできた研究室ですが、河原さんは基盤技術の研究に圧倒的な強さがあり、国内の学会賞を総なめするほどで、国内トップレベルの研究をされています。早稲田に新しい自然言語処理の伝統ができると思っています。

小林研・小川研は音声寄りの研究が多いですが、新たに発足した AI ロボット研究所も含め早稲田はロボット研究に強く、言語に止まらない研究に取り組めます。

酒井研究室は情報検索メインの研究室ですが、自然言語処理も研究分野に含みます。酒井さんが Microsoft Research Asia にいらしたときから世界トップレベルの独創的な研究をされており、大学に移られてからも精力的に活動をされています。

ルパージュ研究室は北九州にあるキャンパスで、機械翻訳の研究や言語資源構築の研究に長年取り組んでらっしゃいます。

法政大学

数理論理学や理論言語学に興味がある人は金沢研究室があります。機械学習や統計的自然言語処理よりフォーマルな計算言語学をやりたい人にお勧めします(小町は学部生時代金沢先生の意味論に関する講義を受講していて、その後 ACL で再会してびっくりしました)。

深層学習を用いた自然言語処理の研究は彌冨(いやとみ)研究室で手がけています。こちらは金沢研究室とは逆で、言語的な知識を可能な限り使わずに言語処理を行うという人にお勧めします。元気な学生の多い研究室なので、開発が好きな人は楽しく過ごせるでしょう。

※金沢研、彌冨研ともに教員が1名です。

中部

豊田工業大学

豊田工大には知能数理研究室があります。深層学習の研究が盛んで、機械学習寄りの研究がしたい人には向いています。トヨタ肝いりの後発の大学ですが、シカゴ大の中にも分校があり、TTIC と呼ばれて機械学習の研究者を中心に世界的に活躍しています。優秀な学生は TTIC に進学するそうです。トップカンファレンスでの発表も堅調で、日本屈指の研究水準を誇っています。学部受験生にとっては有力な選択肢の一つだと思います。

豊橋技術科学大学

豊橋技科大には秋葉研梅村研および土屋研があります。長岡技科大と豊橋技科大は高専からの編入生が多く、学部1年の定員より学部3年の定員のほうが多いので、高専生で自然言語処理の研究をしたい人は、豊橋技科大が有力な候補の一つです。秋葉研は音声検索や質問応答、統計的機械翻訳の研究を継続的にしています。梅村研はウェブマイニングの研究が盛んです。土屋研は2014年に新しくできたばかりですが、日本語の機能表現や言語モデルなど、形態素解析のレイヤーの研究を多く手がけてらっしゃいます。

※秋葉研と土屋研は教員1名です。

名古屋大学

名大には外山研究室佐藤研究室松原研究室そして武田・笹野研究室と東中研究室があります。自然言語処理の研究者が多いので、名古屋地区NLPセミナーというセミナーも定期的に開催されています。豊田工業大学も近くにあります。

外山(とやま)研は法令文の言語処理の研究を継続的にされています。また、シソーラスや対訳辞書の(半)自動構築や機械翻訳に関する研究もしています。

佐藤研は文章の難易度推定著者推定に加え、さまざまな文章の生成の課題、そして構文解析のような要素技術の研究に取り組んでいます。

松原研では音声処理に向けた言語処理の基盤的な研究をコツコツとされています。

武田・笹野研究室は談話解析を中心とした形態素解析も含めた要素技術の研究に圧倒的な強さがあります。

東中研は2020年にできた研究室で、NTT 研究所で日本の対話研究を率いてきた東中さんが教授となり、大学でも世界の対話研究をリードしていく存在になっていくのが楽しみです。

※松原研は教員1名です。

近畿圏

奈良先端科学技術大学院大学(NAIST)

NAIST には中村研荒牧研渡辺研、そして連携講座として鳥澤研があります。NAISTは、日本を代表する自然言語処理のメッカですし、日本を代表する機械学習の研究をする双璧の研究室があり、情報抽出の研究も盛んで、大学院から自然言語処理の研究に飛び込みたい人はまず NAIST に行くと間違いありません。

中村研は、自然言語処理の中でも特に音声翻訳の研究をしています。中村研は日本で世界レベルの(統計的)機械翻訳の研究ができる数少ない研究室なので、自信をもってお勧めできます(ただし、ここ数年は入試の競争率が極めて高いようです)。

また、2015年からはソーシャル・コンピューティング研究室(荒牧研)ができました。ソーシャルメディアのマイニングや医療言語処理で独創的な研究を連発され、国内外の学会賞を多数受賞されています。2020年からは教員2名体制になり、学生数も増えるそうです。将来が楽しみな研究室の一つです。

2019年からは鳥澤研(連携研究室)ができています。基礎から応用まで幅広く手掛け、特に情報抽出では世界トップレベルの研究を量産していて、学生が増えるとどんどん存在感を増して行くでしょう。大規模なデータを使った研究がしたい人は、特に NICT の研究基盤を使うことができるので、とてもよい環境です。

2020年には渡辺研ができました。ニューラル機械翻訳以前の統計的機械翻訳の時代から世界を代表する論文を多数発表しており(渡辺太郎さんの論文やチュートリアルは、いつも読んでいて惚れ惚れします)、今後も形態素解析や構文解析のような要素技術の研究も含めて、すぐにトップレベルの研究成果を挙げる研究室になることを確信しています。

大阪大学

阪大には、鬼塚研究室(ビッグデータ)駒谷研究室(音声対話システム)などに自然言語処理の研究者が点在しています。対話や翻訳、言語教育支援のように今後大きく伸びていく可能性が高い分野の研究に積極的に取り組んでいるので、10年もすれば関西における自然言語処理の三大拠点の一つとなっていることでしょう。

京都大学

京大には黒橋研森研があります。黒橋研は形態素解析(JUMAN)、構文・意味解析(KNP)のような基盤技術で日本の自然言語処理をリードしています。日本が世界に先駆けて提案した用例翻訳のメッカでもあります。森研では実用的な自然言語処理の研究(頑健性が高い、あるいはトータルで見た場合のコストが少ない)を行なっています。どの研究室も大型の研究費を次々に獲得されているので、研究員(ポスドク)の人も多く、国内の研究を引っ張っています。黒橋研は日本を代表する自然言語処理の研究室の一つです。

四国・中国・九州

徳島大学

徳島大には北研究室があります。北研究室はマルチメディア情報検索の研究で有名です(「確率的言語モデル」「情報検索アルゴリズム」という自然言語処理における古典的名著で名前を知っている人も多いでしょう)。

鳥取大学

鳥取大には自然言語処理研究室応用計算知能研究室があります(研究グループ、と言ったほうが適切かも)。機械翻訳から感情分析・情報抽出、統計的自然言語処理まで広くカバーしています。池原先生という機械翻訳に大きな貢献をされた先生がいらしたという経緯もあり、機械翻訳の研究が盛んです。鳥バンクという日英翻訳に関するリソースも公開されています。