2018

自然言語処理を学ぶことができる研究室をリストアップします。自然言語処理の研究をしている教員が2名以上いる大学が対象です(私立大学は法政大学と豊田工業大学のみです)。うち、教員が1研究室で3人以上いるのは北大荒木研、東北大乾研、筑波大山本研、東工大徳永研、東工大奥村研、名大外山研、京大黒橋研、NAIST松本研、NAIST中村研です。教員が1人だけしかいない研究室と、3人以上いる研究室(特に博士後期課程の在学生が多いところと)は質的にも量的にも違うと思いますので、博士後期課程に進学するつもりの人は、少なくとも1カ所はそれらの研究室を見学したほうがよいでしょう。このうち、博士前期課程から入学しやすい(入試が簡単であるという意味ではないですが)のは、NAIST中村研です(松本先生はあと1年で定年です)。

各研究室(大学)の研究力を客観的に知るために、日本所属の言語処理トップカンファレンス論文(2018, 2017, 2016, 2015, 2014)も見るとよいでしょう。これによると、日本の大学でトップカンファレンスに通している数が1本より大きいものをノミネートすると、

    • 2018年: 東大 >> 京大 > 東北大 = NAIST >> 東工大 > 阪大 > 首都大 > 豊田工大 = 早大

    • 2017年: 東大 >> NAIST >> 東工大 > 京大 > 阪大 > 東北大 > JAIST

    • 2016年: NAIST > 京大 > 東北大 >> 東工大 > 東大 > 阪大 = 早大 = 首都大 = 豊田工大 = お茶大

    • 2015年: NAIST >> 京大 > 東工大 > JAIST > 首都大 = 東大 > 長岡技科大

    • 2014年: NAIST >> 京大 > 東大 > 名大 = 東工大 > 豊田工大 = 甲南大

となり、トップカンファレンス論文が多いのは NAIST、京大、東工大、東大で、だいたい有力研究室の感覚に合っています。首都大のうちの研究室は、できてから3年目の2015年にようやくランクインしました(合計3回)。それ以外に複数回ランクインしているのは東北大(3回)、阪大(3回)、豊田工大(3回)、JAIST(2回)、早大(2回)です。2017年は東大と阪大が躍進していますが、東大には博士後期課程の学生が多く、納得の結果です。阪大は研究者(ポスドク)の数が多いので、今後もランクインすると思います(学生目線では、ポスドクの成果はあまり関係ないかもしれませんが)。NAIST は松本先生の定年退職によって、今後変化があると思われます。東大・阪大ともに1研究室によるものではないので、1研究室単位で正規化すると、恐らくランキングは大きく変わっていません。東北大は2016年から伸びています。理研 AIP と按分されている業績もあるので、1研究室としては国内トップです。また、岡崎さんが東北大から東工大に、宮尾さんが NII から東大に移られたので、今後はさらに東大・東工大からの発表論文数が増えることでしょう。2020年以降を予想すると、東大・京大・東北大・東工大が年ごとに入れ替わり、阪大・NAIST・都立大(首都大)がそれに続く、という感じになるのではと思います。

教員が1名のみの研究室は多くありますので、全部を紹介し切ることはできませんし、そのつもりもありません。抜粋した研究室一覧をどうぞ。

    • 大学受験生の人へ: 迷ったら総合大学に進学しましょう。いろいろ勉強して他のことがしたくなることもたくさんあります。総合大学の方が、そういう機会がたくさんあります。NAIST/JAIST/東工大(すずかけ台) のように大学院から来る学生が多い研究室もありますので、学部選択の段階でそこまで絞り込む必要はありません。(また、行きたい研究室をピンポイントに念頭に置いて進学しても、人気研究室でものすごく成績がよくないと入れなかったり、あるいは教員が定年または異動して研究室配属の時期にいなくなっていることもあります)

    • 高専からの編入生の人へ: なんらかの形で自然言語処理の研究がしたいなら、豊橋技科大をお勧めします(長岡技科大の山本研は2019年3月に解散予定です)。あと、専攻科に進学して大学院受験をする人もおり、自然言語処理・機械学習分野で活躍する高専出身生は専攻科出身の人が(編入の人より)多い気がするので、無理に3年次編入しなくてもいいと思います(ちなみに、のちに自然言語処理で活躍する人も、専攻科で自然言語処理の研究をしているとは限りません)。ただし、このところ AI ブームで自然言語処理の大学院入試は厳しいので、行きたい大学院(研究室)があるなら、大学院進学が内部生扱いになるよう、3年次編入した方がいいでしょう。

    • 大学院受験生の人へ: 自然言語処理をしたい、というのは絞り込めているでしょうが、研究テーマは自然言語処理を詳しく勉強したら気が変わることもよくあります(だいたい1/3が入学時にやりたいことを修論にし、2/3は変えています)。この研究テーマだからここでないと、という場合もありますが、それよりは実際に見学したりブログ、Twitter などで教員や在学生の人となりを見たりして、自分に合っている雰囲気かどうかで選んだ方がいいです。最近は大学院入試が過熱気味なので、優れた研究環境の研究室はどこも選抜が厳しいと思ってください(そのため、研究環境というよりは相性で選んだ方が、希望が叶えられる可能性が高いです。)。

    • 留学生の人へ: 大学院から自然言語処理の研究がしたいなら、NAIST/JAIST/総研大が(少なくとも留学生にとっては)いい選択肢です。東京の大学がいいなら、総研大以外では東大・東工大に自然言語処理のよい研究室があります。これ以外は東北大・京大・阪大がよいです。ただし、これらの大学はとても選抜が厳しいです。日本人は日本語ができるので、地方にあるいい研究室に進学することも検討できますが、留学生の人は地方の大学だと周りに留学生がほとんどいないことがあるので、相当優秀な人(日本語がものすごくできて日本人と一緒に研究できるか、あるいは日本人と一緒に研究しなくても自分でどんどん研究できる人)でないと自然言語処理の研究をすることはお勧めしません。

大学院から自然言語処理に専門を変えたい、いわゆる文系出身の方は、あらゆる意味でのサポートが充実している NAIST を断然お勧めします。それ以外であれば、東工大徳永研、東大相澤研あたりは文系出身の人が複数人いるようです(他にご存知の方がいたら小町までご連絡ください)。理工系出身ではない人が自然言語処理の研究をしたい場合、修士号を持っていても博士後期課程から入学すると基礎知識のある前提で研究をしなければならず、正規の年数での博士号取得が困難であることが予想されるため、もう一度修士から入り直すことを強くお勧めいたします(優秀な方であれば、修士〜博士に5年間かからず、短期終了できるはずですし、日本学術振興会の特別研究員に採用される人も多いと思います)。また、「理転したい」と思って自然言語処理を専攻する人がいますが、修士の2年間だけの研究では基本的に自然言語処理の専門性があるとは見なされません(学部から続けている人も、難関国際会議の発表経験があったりしないと、専門性があると見なされないと思いますが)。自然言語処理とは関係なく(学部時代にプログラミングを独学していた経験を活かして、ウェブアプリ開発等の)ソフトウェアエンジニア、または(コミュニケーション力を活かして)いわゆる SIer 等で働きたい、というのであれば希望通り就職できる可能性が高いでしょうが、自然言語処理に関する仕事がしたいというのであれば過半数の人は叶わないと思いますので、博士後期課程に進学してから就職活動をすることをお勧めします。

首都圏で進学できる自然言語処理の学べる大学を探している人へ。大学受験であれば、入学してから気が変わることは往々にしてありますし、研究室に配属される B3/B4 までに状況が変わることもあるので、研究内容にこだわって大学を選ぶことはお勧めしません。どうしても自然言語処理の研究室のある大学に行きたい、という場合、言語自体に興味がある人は総合大学の東大・首都大・筑波大、完全に工学(情報)にしか興味がないのであれば東工大・電通大をお勧めします。私立で自然言語処理をメインに研究している大学はあまりないのですが、どこか1つ挙げてほしい、と言われたら、早慶上理なら断然早稲田大学、(M)ARCH なら断然法政大学(西東京であれば東京工科大)、中京地区なら断然豊田工大、関関同立なら立命館、産近甲龍なら断然甲南大をお勧めします。

北海道・東北

東北大学

東北には乾・鈴木研究室があります。推論(含意関係認識)や意味・談話そして対話処理の研究に強みがあります。Twitter に代表されるソーシャルメディアの解析のようなアプリケーションから、機械学習を駆使した情報抽出の研究まで、幅広く手がけています。前任の准教授の岡崎さんに続き、NTT研究所にいた鈴木さんも機械学習分野で日本の自然言語処理を牽引するリーダーの1人で、ものすごくクオリティの高い研究をしています。トップ国際会議に学生が通したり、国内外の学会賞を立て続けに受賞するなど、研究のレベルの高さは胸を張って保証できます。博士後期課程に進学する学生も多いですが、修士で就職する学生も最先端の研究開発をする企業に就職して大活躍しており、研究員の数も圧倒的で、日本の自然言語処理をリードする研究室の一つです。理研AIPの拠点の一つで、研究員もたくさん在籍しています。

東北大学 乾・鈴木研究室への配属を検討している皆さんへ」は乾研志望の人でなくても、研究室選択の参考になると思いますので、一読することをお勧めします。

北海道大学

北海道には荒木研究室があります。ACL 2003 や言語処理学会2014年のホストを務めるなど、国内外の学会も運営されています。北海学園大の越前谷博さん、小樽商科大の木村泰知さんといった北海道の大学での研究者を輩出しているとともに、青山学院大の内田ゆずさん、福岡大の乙武北斗さんなど、国内の大学にも卒業生がいます。

北見工業大学

北見工大には桝井・プタシンスキ研究室があります。自然言語処理の中でも特にテキストマイニングや情報抽出、そしてそれを活用した観光情報学の研究が盛んです。

首都圏(除く東京)

筑波大学

筑波大学には山本研究室宇津呂研究室があります。山本研は言語モデルとウェブデータ分析、宇津呂研は対訳辞書構築やウェブデータ(Twitter や Wikipedia、ブログといったユーザ参加型のメディア)の分析に一日の長があります。本気で言語モデルの研究をしたいなら、山本研は日本で最先端の研究ができる数少ない大学の一つです。山本研の乾さんは評価極性分析などウェブデータの分析に長年取り組んでらっしゃいますし、特に日本語の言語的な特徴を考慮した研究をしたい人にお勧めします。

※宇津呂研は教員が1名です。

茨城大学

茨城大学には佐々木研究室新納研究室古宮研究室があります。佐々木研究室と新納研究室はいずれも機械学習を用いた自然言語処理の研究を地道に続けてらっしゃいます(深層学習を用いた研究にも積極的に取り組んでらっしゃいます)。古宮研究室は2014年にできた新しい研究室で、自然言語処理における分野適応の研究を精力的にされています。

※いずれの研究室も教員1名です。

東京

東京工業大学

東工大には徳永・藤井研究室岡崎研究室奥村研究室・高村研究室があります(徳永・藤井研と岡崎研は大岡山キャンパス、奥村・高村研はすずかけ台キャンパス)。

徳永研ではコーパスアノテーションを中心としたマルチモーダルな対話処理の研究、藤井研ではウェブマイニングの研究がそれぞれ盛んです。岡崎研究室は機械学習を中心とした自然言語処理全般の研究をしています。オープンソース開発や企業との連携も含め、広く技術を社会に還元しています。2017年にできたばかりですが、日本を代表する研究室になると確信しています。

奥村研ではレビューやブログを対象としたウェブマイニングのような応用から頑健な形態素解析や照応解析のような基礎的な研究までカバーしています。高村さんが研究活動の主軸を産総研に移してしまいました(本務が産総研で、クロスアポイントメント制度を利用して20%大学の仕事)が、奥村研は大学院からの入学定員が多いので、大学院から自然言語処理の研究をしたい人には広く門戸を開いています。奥村研で修士号を取った人は、国内トップクラスの優れた研究能力を持っていることに太鼓判を押せます(ただし、修士号が2年間で取れるとは限りません。本人の能力と適性に応じて、もっとかかる人もいます。自分も学部時代は3年留年して7年間学部生をしていたので、しっかり学ぶことは大事だと思っています。)。

※岡崎研は教員1名です。

東京大学

東大には電子情報工学科に鶴岡研究室があります。鶴岡研は基礎レイヤーの仕事がおもしろく、コンピュータゲーム(将棋)と自然言語処理という、人工知能で言う「探索」を用いた独創的な研究をされていて、とても刺激的です。最近は深層学習が盛んです。同じく電子情報工学科で、物理的には東大生産研(駒場)の吉永さん(吉永研究室)は機械学習的な観点からの実用的な自然言語処理の研究を盛んにされています。

一方、コンピュータ科学科の宮尾研究室も自然言語処理の基礎的な研究(構文解析、意味解析、推論)をしたい人にお勧めです。同じくコンピュータ科学科で、物理的には国立情報学研究所(竹橋)の相澤研究室でも言語処理に関する研究をしています。翻訳・論文作成支援など、言語処理を用いたコミュニケーションの支援が盛んです。

また、東大先端研の田中研究室も言語処理の研究をされています。自然言語処理というよりは計算言語学という趣で、言語に関する数理モデルの研究が興味深いです。駒場の言語情報科学の加藤研究室も語彙概念構造などの意味論に基づく研究や情報アクセスに関する研究をしています。

最近は創造情報学の中山研究室も自然言語処理の研究に積極的に取り組んでおり、画像と言語や自然言語処理のための深層学習でおもしろい研究を連発しています。数年後には押しも押されぬ自然言語処理の新進気鋭の研究室となっていることでしょう。研究室紹介のメッセージは、中山研に限らず深層学習を研究テーマにしたい人に非常に参考になるメッセージが書かれているので、ご一読ください。

※全て教員1名です。

お茶の水女子大学

お茶大には戸次(べっき)研究室小林研究室があります。戸次研究室は組合せ範疇文法や依存型理論、圏論などを用いた数理言語学的アプローチによる研究で世界的に有名で、コンスタントにメジャー国際会議で発表・招待講演をしています(国内外の賞も受賞多数です)。小林研究室はトピックモデルやグラフを用いた自然言語処理の研究をしていましたが、最近は脳情報処理やロボット系の研究が増えてきました。自然言語処理に興味がある女子学生であれば、お茶大はかなり有力かつお勧めな進学先です。女子大学ですが、共同研究生として男子学生も滞在できるようです。

※小林研は教員1名です。

電気通信大学

電通大には内海研究室松吉研究室があります。内海研究室は認知科学寄りの研究に独自性があります。松吉研究室は2016年にできた新しい研究室ですが、言語学的な分析を丁寧に行う言語処理で定評があります(国内学会の賞を多数受賞されています)。言語資源の作成に興味がある人は、松吉研究室をお勧めいたします。

※内海研、松吉研ともに教員が1名です。

法政大学

数理論理学や理論言語学に興味がある人は金沢研究室があります。機械学習や統計的自然言語処理よりフォーマルな計算言語学をやりたい人にお勧めします(小町は学部生時代金沢先生の意味論に関する講義を受講していて、その後 ACL で再会してびっくりしました)。

深層学習を用いた自然言語処理の研究は彌冨(いやとみ)研究室で手がけています。こちらは金沢研究室とは逆で、言語的な知識を可能な限り使わずに言語処理を行うという人にお勧めします。元気な学生の多い研究室なので、開発が好きな人は楽しく過ごせるでしょう。

※金沢研、彌冨研ともに教員が1名です。

中部

豊田工業大学

豊田工大には知能数理研究室があります。深層学習の研究が盛んで、機械学習寄りの研究がしたい人には向いています。トヨタ肝いりの後発の大学ですが、シカゴ大の中にも分校があり、TTIC と呼ばれて機械学習の研究者を中心に世界的に活躍しています。優秀な学生は TTIC に進学するそうです。トップカンファレンスでの発表も堅調で、日本屈指の研究水準を誇っています。学部受験生にとっては有力な選択肢の一つだと思います。

豊橋技術科学大学

豊橋技科大には秋葉研梅村研井佐原研および土屋研があります。長岡技科大と豊橋技科大は高専からの編入生が多く、学部1年の定員より学部3年の定員のほうが多いので、高専生で自然言語処理の研究をしたい人は、豊橋技科大が有力な候補の一つです。秋葉研は音声検索や質問応答、統計的機械翻訳の研究を継続的にしています。梅村研はウェブマイニングの研究が盛んです。土屋研は2014年に新しくできたばかりですが、日本語の機能表現や言語モデルなど、形態素解析のレイヤーの研究を多く手がけてらっしゃいます。

※秋葉研と土屋研は教員1名です。井佐原先生は2020年3月に定年退職見込みです。

名古屋大学

名大には外山研究室佐藤・松崎研究室松原研究室そして武田・笹野研究室があります。外山(とやま)研は法令文の言語処理の研究を継続的にされています。また、シソーラスや対訳辞書の(半)自動構築や機械翻訳に関する研究もしています。佐藤・松崎研は文章の難易度推定著者推定に加え、さまざまな文章の生成の課題、そして構文解析のような要素技術の研究に取り組んでいます。松原研では音声処理に向けた言語処理の基盤的な研究をコツコツとされています。武田・笹野研究室は談話解析を中心とした形態素解析も含めた要素技術の研究に圧倒的な強さがあります。自然言語処理の研究者が多いので、名古屋地区NLPセミナーというセミナーも定期的に開催されています。豊田工業大学も近くにあります。

※松原研は教員1名です。

近畿圏

奈良先端科学技術大学院大学(NAIST)

NAIST には松本研中村研があります。松本研は自然言語処理全般の研究を行なっています。形態素解析(ChaSenやMeCab)・構文解析(CaboCha)のような要素技術がお家芸です。機械学習やデータマイニングの研究も行なっています。中村研は、自然言語処理の中でも特に音声翻訳の研究をしています。中村研は日本で世界レベルの(統計的)機械翻訳の研究ができる数少ない研究室なので、自信をもってお勧めできます(ただし、ここ数年は入試の競争率が極めて高いようです)。2014年に日本から自然言語処理のトップカンファレンスにどれくらい採択されたか、所属機関別にまとめたものを見ても、大学2位の京大に圧倒的な差をつけているのが分かるでしょう。NAISTは、日本を代表する自然言語処理のメッカですし、松本研は世界的にも有名な自然言語処理研究室の一つです。

また、2015年からはソーシャル・コンピューティング研究室(荒牧研)ができました。ソーシャルメディアのマイニングや医療言語処理で独創的な研究を連発され、国内外の学会賞を多数受賞されています。将来が楽しみな研究室の一つです。

※荒牧研は教員1名です(ただし、研究員が多数在籍します)。また、松本先生は2020年3月定年退職見込みですが、2018年度の入試で受験できるようです。

大阪大学

阪大には自然言語処理を独立して研究している研究室はないのですが、鬼塚研究室(ビッグデータ)、駒谷研究室(音声対話システム)、データビリティフロンティア機構(知能情報基盤)などに自然言語処理の研究者が点在しています。研究者数でいうと京都大学とほぼ同等の数ですし、対話や翻訳、言語教育支援のように今後大きく伸びていく可能性が高い分野の研究に積極的に取り組んでいるので、10年もすれば関西における自然言語処理の三大拠点の一つとなっていることでしょう。

京都大学

京大には黒橋・河原研森研があります。黒橋・河原研は形態素解析(JUMAN)、構文・意味解析(KNP)のような基盤技術で日本の自然言語処理をリードしています。日本が世界に先駆けて提案した用例翻訳のメッカでもあります。森研では実用的な自然言語処理の研究(頑健性が高い、あるいはトータルで見た場合のコストが少ない)を行なっています。どの研究室も大型の研究費を次々に獲得されているので、研究員(ポスドク)の人も多く研究を引っ張っています。黒橋研は日本を代表する自然言語処理の研究室の一つです。また、ホンダ・リサーチ・インスティチュート・ジャパンとの共同研究講座もあります。

四国・中国・九州

徳島大学

徳島大には北研究室があります。北研究室はマルチメディア情報検索の研究で有名です(「確率的言語モデル」「情報検索アルゴリズム」という自然言語処理における古典的名著で名前を知っている人も多いでしょう)。

愛媛大学

愛媛大には二宮研究室があります。二宮さんは構文解析を中心とした基盤技術の解析で世界的に有名です。田村さんは新進気鋭の研究者で、深層学習を中心とした自然言語処理の基礎から応用まで幅広くカバーされています。特に最近はニューラル機械翻訳に力を入れていて、日本における機械翻訳三大研究室(首都大小町研、NAIST 中村研、愛媛大二宮研)の一つです。

鳥取大学

鳥取大には自然言語処理研究室応用計算知能研究室があります(研究グループ、と言ったほうが適切かも)。機械翻訳から感情分析・情報抽出、統計的自然言語処理まで広くカバーしています。池原先生という機械翻訳に大きな貢献をされた先生がいらしたという経緯もあり、機械翻訳の研究が盛んです。鳥バンクという日英翻訳に関するリソースも公開されています。

※応用計算知能研究室(徳久研究室)は教員1名です。