2017

自然言語処理を学ぶことができる研究室をリストアップします。自然言語処理の研究をしている教員が2名以上いる大学が対象です(残念ながら、私立大学は豊田工業大学のみです)。うち、教員が1研究室で3人以上いるのは北大荒木研、筑波大山本研、東工大徳永研、名大外山研、京大黒橋研、NAIST松本研、NAIST中村研です。教員が1人だけしかいない研究室と、3人以上いる研究室(特に博士後期課程の在学生が多いところと)は質的にも量的にも違うと思いますので、博士後期課程に進学するつもりの人は、少なくとも1カ所はそれらの研究室を見学したほうがよいでしょう。このうち、博士前期課程から入学しやすいのは、NAIST松本研、NAIST中村研です(ただし、松本先生はあと2年ほどで定年ですので、博士後期課程に進学したい人は他の研究室がよいでしょう)。

各研究室(大学)の研究力を客観的に知るために、日本所属の言語処理トップカンファレンス論文(2017, 2016, 2015, 2014)も見るとよいでしょう。これによると、日本の大学でトップカンファレンスに通している数が1本より大きいものをノミネートすると、

    • 2017年: 東大 >> NAIST >> 東工大 > 京大 > 阪大 > 東北大 > JAIST

    • 2016年: NAIST > 京大 > 東北大 >> 東工大 > 東大 > 阪大 = 早大 = 首都大 = 豊田工大 = お茶大

    • 2015年: NAIST >> 京大 > 東工大 > JAIST > 首都大 = 東大 > 長岡技科大

    • 2014年: NAIST >> 京大 > 東大 > 名大 = 東工大 > 豊田工大 = 甲南大

となり、トップカンファレンス論文が多いのは NAIST、京大、東工大、東大、東北大(このうち NAIST と京大が頭一つ抜けた二大巨頭)で、だいたい有力研究室の感覚に合っています。首都大のうちの研究室は、できてから3年目の2015年にようやくランクインしました。それ以外に複数回ランクインしているのは豊田工大です。2017年は東大と阪大が躍進していますが、東大には博士後期課程の学生が多く、納得の結果です。東大・阪大ともに1研究室によるものではないので、1研究室単位で正規化すると、恐らくランキングは大きく変わっていません。東北大から岡崎さんが東工大に移られたので、今後は東工大からの発表論文数が増えることでしょう。

いわゆる文系出身の方は、あらゆる意味でのサポートが充実している NAIST を断然お勧めします。それ以外であれば、東工大徳永研・総研大相澤研あたりは文系出身の人が複数人いるようです(他にご存知の方がいたら小町までご連絡ください)。理工系出身ではない人が自然言語処理の研究をしたい場合、修士号を持っていても博士後期課程から入学すると基礎知識のある前提で研究をしなければならず、正規の年数での博士号取得が困難であることが予想されるため、もう一度修士から入り直すことを強くお勧めいたします(優秀な方であれば、修士〜博士に5年間かからず、短期終了できるはずですし、日本学術振興会の特別研究員に採用される人も多いと思います)。

首都圏で進学できる自然言語処理の学べる大学を探している人へ。大学受験であれば、入学してから気が変わることは往々にしてありますし、研究室に配属される B3/B4 までに状況が変わることもあるので、あまり研究内容にこだわって大学を選ぶことはお勧めしません。どうしても自然言語処理の研究室のある大学に行きたい、という場合、言語自体に興味がある人は総合大学の東大・首都大、完全に工学(情報)にしか興味がないのであれば東工大・電通大をお勧めします。私立で自然言語処理をメインに研究している大学はほとんどないのですが、どこか1つ挙げてほしい、と言われたら、早稲田大学(酒井研究室、尾形研究室、石川研究室)あるいは法政大学(彌冨研究室)をお勧めします。

教員が1名のみの研究室は多くありますので、全部を紹介し切ることはできませんし、そのつもりもありません。抜粋した研究室一覧をどうぞ。

    • 大学受験生の人へ: 迷ったら総合大学に進学しましょう。いろいろ勉強して他のことがしたくなることもたくさんあります。総合大学の方が、そういう機会がたくさんあります。NAIST のように大学院から来る学生が多い研究室もありますので、学部選択の段階でそこまで絞り込む必要はありません。(また、行きたい研究室をピンポイントに念頭に置いて進学しても、人気研究室でものすごく成績がよくないと入れなかったり、あるいは教員が定年または異動して研究室配属の時期にいなくなっていることもあります)

    • 高専からの編入生の人へ: なんらかの形で自然言語処理の研究がしたいなら、豊橋技科大をお勧めします。自然言語処理の研究室がとても多いので、どこに行ってもレベルの高い研究ができるでしょう。専攻科に進学して大学院受験をする人もおり、自然言語処理・機械学習分野で活躍する高専出身生は専攻科出身の人が(編入の人より)多い気がするので、もし専攻科で学びたい先生がいるなら、無理に3年次編入しなくてもいいと思います(ちなみに、のちに自然言語処理で活躍する人も、専攻科で自然言語処理の研究をしているとは限りません)。

    • 大学院受験生の人へ: 自然言語処理をしたい、というのは絞り込めているでしょうが、研究テーマは自然言語処理を詳しく勉強したら気が変わることもよくあります(だいたい1/3が入学時にやりたいことを修論にし、2/3は変えています)。この研究テーマだからここでないと、という場合もありますが、それよりは実際に見学したりブログ、Twitter などで教員や在学生の人となりを見たりして、自分に合っている雰囲気かどうかで選んだ方がいいです。

    • 留学生の人へ: 自然言語処理の研究がしたいなら、NAIST/JAIST/総研大が(少なくとも留学生にとっては)いい選択肢です。東京の大学がいいなら、総研大以外では東大・東工大・電通大に自然言語処理のよい研究室があります。

北海道・東北

東北大学

東北には乾研究室があります。推論(含意関係認識)や意味・談話そして対話処理の研究に強みがあります。Twitter に代表されるソーシャルメディアの解析のようなアプリケーションから、機械学習を駆使した情報抽出の研究まで、幅広く手がけています。2010年にできたばかりですが、トップ国際会議に学生が通したり、国内外の学会賞を立て続けに受賞するなど、研究のレベルの高さは胸を張って保証できます。研究員の数も圧倒的で、日本の自然言語処理をリードする研究室の一つです。

北海道大学

北海道には荒木研究室があります。ACL 2003 や言語処理学会2014年のホストを務めるなど、国内外の学会も運営されています。北海学園大の越前谷博さん、小樽商科大の木村泰知さんといった北海道の大学での研究者を輩出しているとともに、青山学院大の内田ゆずさん、福岡大の乙武北斗さんなど、国内の大学にも卒業生がいます。

首都圏(除く東京)

筑波大学

筑波大学には山本研究室宇津呂研究室があります。山本研は言語モデルとウェブデータ分析、宇津呂研は対訳辞書構築やウェブデータ(Twitter や Wikipedia、ブログといったユーザ参加型のメディア)の分析に一日の長があります。本気で言語モデルの研究をしたいなら、山本研は日本で最先端の研究ができる数少ない大学の一つです。

※宇津呂研は教員が1名です。

茨城大学

茨城大学には佐々木研究室新納研究室古宮研究室があります。佐々木研究室と新納研究室はいずれも機械学習を用いた自然言語処理の研究を地道に続けてらっしゃいます。古宮研究室は2014年にできた新しい研究室で、自然言語処理における分野適応の研究を精力的にされています。

※いずれの研究室も教員1名です。

東京

総合研究大学院大学

総研大は国立情報学研究所の宮尾研究室も自然言語処理の基礎的な研究(構文解析、意味解析、推論)をしたい人にお勧めです。また、数理論理学や理論言語学に興味がある人は金沢研究室があります。機械学習や統計的自然言語処理よりフォーマルな計算言語学をやりたい人にお勧めします(小町は学部生時代金沢先生の意味論に関する講義を受講していて、その後 ACL で再会してびっくりしました)。

また、統計数理研究所の所属になる持橋研究室は統計的自然言語処理や言語モデリングで世界的に著名で、教師なし形態素解析の研究が特に有名です。

※いずれも教員1名です。

東京工業大学

東工大には徳永・藤井研究室岡崎研究室奥村研究室・高村研究室があります(徳永・藤井研と岡崎研は大岡山キャンパス、奥村・高村研はすずかけ台キャンパス)。

徳永研ではコーパスアノテーションを中心としたマルチモーダルな対話処理の研究、藤井研ではウェブマイニングの研究がそれぞれ盛んです。岡崎研究室は機械学習を中心とした自然言語処理全般の研究をしています。オープンソース開発や企業との連携も含め、広く技術を社会に還元しています。2017年にできたばかりですが、日本を代表する研究室になると確信しています。

奥村研ではレビューやブログを対象としたウェブマイニングのような応用から頑健な形態素解析や照応解析のような基礎的な研究までカバーしています。高村さんが研究活動の主軸を産総研に移してしまいましたが、奥村研は大学院からの入学定員が多いので、大学院から自然言語処理の研究をしたい人には広く門戸を開いています。

※岡崎研は教員1名です。

東京大学

東大には鶴岡研究室があります。鶴岡研は基礎レイヤーの仕事がおもしろく、コンピュータゲーム(将棋)と自然言語処理という、人工知能で言う「探索」を用いた独創的な研究をされていて、とても刺激的です。最近は深層学習が盛んです。東大生産研の喜連川研究室の吉永さん(吉永研究室)は機械学習的な観点からの実用的な自然言語処理の研究を盛んにされています。東大先端研の田中研究室も言語処理の研究をされています。自然言語処理というよりは計算言語学という趣で、言語に関する数理モデルの研究が興味深いです。国立情報学研究所(NII)の相澤研究室でも言語処理に関する研究をしています。翻訳・論文作成支援など、言語処理を用いたコミュニケーションの支援が盛んです。

※全て教員1名です。

電気通信大学

電通大には内海研究室松吉研究室があります。内海研究室は認知科学寄りの研究に独自性があります。松吉研究室は2016年にできた新しい研究室ですが、言語学的な分析を丁寧に行う言語処理で定評があります(国内学会の賞を多数受賞されています)。言語資源の作成に興味がある人は、松吉研究室をお勧めいたします。

※内海研、松吉研ともに教員が1名です。

中部

豊田工業大学

豊田工大には知能数理研究室があります。深層学習の研究が盛んで、機械学習寄りの研究がしたい人には向いています。トヨタ肝いりの後発の大学ですが、シカゴ大の中にも分校があり、TTIC と呼ばれて機械学習の研究者を中心に世界的に活躍しています。優秀な学生は TTIC に進学するそうです。トップカンファレンスでの発表も堅調で、学部受験生にとっては有力な選択肢の一つだと思います。

豊橋技術科学大学

豊橋技科大には秋葉研・塚田研と増山研井佐原研および土屋研があります。長岡技科大と豊橋技科大は高専からの編入生が多く、学部1年の定員より学部3年の定員のほうが多いので、高専生で自然言語処理の研究をしたい人は、豊橋技科大が有力な候補の一つです。秋葉研は音声検索や質問応答、統計的機械翻訳の研究を継続的にしています。増山研は博士号を取得する人もけっこういる歴史ある研究室で、テキストマイニングや情報抽出が強いです。井佐原研はできたばかりなのでどういう研究室になるのか分かりませんが、今後の展開が楽しみです。土屋研も2014年に新しくできたばかりですが、日本語の機能表現や言語モデルなど、形態素解析のレイヤーの研究を多く手がけてらっしゃいます。

※秋葉研と土屋研は教員1名です。

名古屋大学

名大には外山研究室佐藤・松崎研究室松原研究室そして武田・笹野研究室があります。外山(とやま)研は法令文の言語処理の研究を継続的にされています。また、シソーラスや対訳辞書の(半)自動構築や機械翻訳に関する研究もしています。佐藤・松崎研は文章の難易度推定著者推定に加え、さまざまな文章の生成の課題、そして構文解析のような要素技術の研究に取り組んでいます。松原研では音声処理に向けた言語処理の基盤的な研究をコツコツとされています。武田・笹野研究室は談話解析を中心とした形態素解析も含めた要素技術の研究に圧倒的な強さがあります(ただし、笹野さんは2017年から在外研究中です)。自然言語処理の研究者が多いので、名古屋地区NLPセミナーというセミナーも定期的に開催されています。豊田工業大学も近くにあります。

近畿圏

奈良先端科学技術大学院大学(NAIST)

NAIST には松本研中村研があります。松本研は自然言語処理全般の研究を行なっています。形態素解析(ChaSenやMeCab)・構文解析(CaboCha)のような要素技術がお家芸です。機械学習やデータマイニングの研究も行なっています。中村研は、自然言語処理の中でも特に音声翻訳の研究をしています。中村研は日本で世界レベルの(統計的)機械翻訳の研究ができる数少ない研究室なので、自信をもってお勧めできます。2014年に日本から自然言語処理のトップカンファレンスにどれくらい採択されたか、所属機関別にまとめたものを見ても、大学2位の京大に圧倒的な差をつけているのが分かるでしょう。NAISTは、日本を代表する自然言語処理のメッカですし、松本研は世界的にも有名な自然言語処理研究室の一つです。

また、2015年からはソーシャル・コンピューティング研究室(荒牧研)ができました。ソーシャルメディアのマイニングや医療言語処理で独創的な研究を連発され、国内外の学会賞を多数受賞されています。将来が楽しみな研究室の一つです。

※荒牧研は教員1名です。また、松本先生はあと2年ほどで定年です。

京都大学

京大には黒橋・河原研森研があります。黒橋・河原研は形態素解析(JUMAN)、構文・意味解析(KNP)のような基盤技術で日本の自然言語処理をリードしています。日本が世界に先駆けて提案した用例翻訳のメッカでもあります。森研では実用的な自然言語処理の研究(頑健性が高い、あるいはトータルで見た場合のコストが少ない)を行なっています。どの研究室も大型の研究費を次々に獲得されているので、研究員(ポスドク)の人も多く研究を引っ張っています。黒橋研は日本を代表する自然言語処理の研究室の一つです。

※森研究室は教員1名です。

四国・中国・九州

徳島大学

徳島大には北研究室があります。北研究室はマルチメディア情報検索の研究で有名です(「確率的言語モデル」「情報検索アルゴリズム」という自然言語処理における古典的名著で名前を知っている人も多いでしょう)。

岡山県立大学

岡山県立大には菊井研究室磯崎研究室があります。お2人とも NTT で長く自然言語処理の研究をされてきて、大学に移られてからは「ロボットは東大に入れるか」いわゆる東ロボプロジェクトに関する発表が増えてきましたが、今後どういう研究室になっていくか楽しみです。

鳥取大学

鳥取大には自然言語処理研究室応用計算知能研究室があります(研究グループ、と言ったほうが適切かも)。機械翻訳から感情分析・情報抽出、統計的自然言語処理まで広くカバーしています。池原先生という機械翻訳に大きな貢献をされた先生がいらしたという経緯もあり、機械翻訳の研究が盛んです。鳥バンクという日英翻訳に関するリソースも公開されています。

※応用計算知能研究室(徳久研究室)は教員1名です。