学生募集

小町を指導教員にと考えてこのページを訪れてくれた人、どうもありがとうございます。首都大学東京システムデザイン学部情報通信システムコース (システムデザイン研究科情報通信システム学域) 小町研究室は自然言語処理の研究をしています。情報系に限らず、他分野の学科(人文・教育系を含む)出身で自然言語処理分野の基礎・応用の研究をしたい人を広く募集しています。研究の分かる(できる)エンジニアを輩出することを目指しています。本研究室は言語(英語、日本語)に関する知識、プログラミングに関する知識、機械学習に関する知識のいずれかに優れ、最先端の研究を挑戦する開拓精神に溢れた人をお待ちしています。また、人文系出身に限らず、女性、海外出身の方(外国人留学生や海外で学んだ経験のある日本人学生)、社会人経験者(セミリタイヤ後含む)、留年・短期修了(飛び級)、障害のある方など、様々なバックグラウンドのある方を歓迎します。

大学院入試は夏季と冬季にあり、それぞれ7月末〜8月頭、1月下旬が試験日(出願はそれぞれ7月および1月。留学生は出願資格審査があるので、それぞれ6月と12月に申請する必要があります)となります。毎年4-5月に大学院入試説明会がありますし、研究室見学はいつでも受け付けています(できれば研究室の勉強会に参加して研究室の雰囲気を体験してほしいので、長期休暇期間よりは授業期間の方をお勧めします)。

本研究室の博士前期課程は原則として夏季入試のみ受験を認めています(2017年の夏季は定員6人、うち筆記試験免除の内部進学生が最大4人)。文系の人、留学生の人、社会人の人、留学していて大学院受験の時期がずれてしまった人、など特殊な事情があれば、冬季入試も受験を認めます(2018年1月の冬季入試にも1人定員を設ける予定です)。ただし、冬季入試は夏季入試より選抜が厳しいので、どうしてもタイミング的に冬季入試しか受けられない、というのでなければ、夏季入試を受けてください。2017年度は研究室の座席が逼迫しているので、夏季入試の合格辞退者がいなければ冬季で受け入れることができません。2018年1月の入試に問い合わせいただいても、研究生をご案内するしかない可能性がありますので、ご了承ください。博士後期課程は夏季入試および冬季入試のいずれも受験を認めています。

本学以外で自然言語処理の研究ができる大学をまとめています。大学院から自然言語処理を学びたい人は、首都圏であれば東工大奥村・高村研、首都圏にこだわらなければ NAIST 松本研(自然言語処理に関するあらゆるテーマ)および中村研(対話・機械翻訳をやりたい人)をお勧めします。

目次

  1. 1 研究について
    1. 1.1 Q: 好きな研究ができますか?
    2. 1.2 Q: 研究室見学はできますか?
    3. 1.3 Q: 他の研究室と研究テーマはどう違うのですか?
  2. 2 進路について
    1. 2.1 Q: 経済的に不安なのですが、大学院に進学したほうがよいでしょうか?
    2. 2.2 Q: 卒業後はどのような進路がありますか?
    3. 2.3 Q: インターンシップに行ってもいいですか?
  3. 3 内部進学について
    1. 3.1 Q: 履修しておいたほうがよい授業はありますか?
    2. 3.2 Q: どのようにすれば小町研究室に配属されますか?
    3. 3.3 Q: 他大学に進学希望なのですが、かまいませんか?
    4. 3.4 Q: 修士には進学せず、就職予定なのですが、かまいませんか?
    5. 3.5 Q: 基礎勉強会に参加してみたいのですが、かまいませんか?
  4. 4 博士前期課程について
    1. 4.1 Q: 他大学からの大学院進学ですが、大丈夫ですか?
    2. 4.2 Q: 人文・社会科学系からの進学希望ですが、かまいませんか?
    3. 4.3 Q: 博士には進学せず、就職希望なのですが、かまいませんか?
    4. 4.4 Q: NAIST 松本研とどう違いますか?
  5. 5 博士後期課程について
    1. 5.1 Q: 博士後期課程に進学してやっていける自信がありません。
    2. 5.2 Q: 博士後期課程に進学したいです。
    3. 5.3 Q: 社会人博士は受け入れていますか?
  6. 6 外国人留学生について
    1. 6.1 Q: 留学生を受け入れていますか?
    2. 6.2 Q: 日本語の能力はどれくらいあればよいですか?
    3. 6.3 Q: 日本語ができれば英語はできなくても大丈夫ですか?
  7. 7 研究生について
    1. 7.1 Q: 研究生を受け入れていますか?
    2. 7.2 Q: 研究生と一般学生との違いはありますか?
  8. 8 入試について
    1. 8.1 Q: 推薦入試はありますか?
    2. 8.2 Q: 出願前に連絡をしなくてもいいですか?
    3. 8.3 Q: 他大学と併願してもかまいませんか?
    4. 8.4 Q: 英語はどれくらいできればいいですか?
    5. 8.5 Q: 数学はどれくらいできればいいですか?
    6. 8.6 Q: プログラミングはどれくらいできればいいですか?
    7. 8.7 Q: 受かるかどうか、不安です。
    8. 8.8 Q: 研究計画書には何を書いたらよいですか?
    9. 8.9 Q: 博士後期課程に進学する予定はありませんが、受験してもいいですか?
  9. 9 環境について
    1. 9.1 Q: 研究室はどのような感じでしょうか?
    2. 9.2 Q: コアタイムはありますか?

研究について

Q: 好きな研究ができますか?

A: はい、好きな研究テーマをしてください。新しい研究分野を切り開くような研究テーマにむしろ積極的に挑戦してもらったほうが嬉しいです。

B4で配属された人は、夏休みまでの課題として研究室で用意した複数のテーマ(例えば機械翻訳、対話、言語学習支援、ソーシャルメディア解析など)の中から1つを選択し、大学院生1名をメンターとしてつけ、8月まで取り組み、9月の NLP(自然言語処理)若手の会シンポジウムで発表してもらいます。そのテーマを特別研究まで継続するもよし、10月からは違うテーマにするもよし、自らおもしろいと思う研究に取り組んでください。

2016年度の学部4年生5人中2人が査読付き国際会議に投稿しました。2015年度の学部4年生4人中1人が査読付き国際会議(トップカンファレンスの学生セッション)で発表しました。2014年度の学部4年生4人中2人が査読付き国際会議(1件はトップカンファレンスのフルペーパー、もう1件はトップカンファレンスの学生セッション)で発表しました。学部生で自然言語処理のトップカンファレンスにフルペーパーで採択されるのは極めて珍しい(小町の知る限り日本人では初めて)ですが、難関国際会議に通すのが珍しくないような研究室にしたいと考えているので、みなさんもどんどんバッターボックスに立ってもらえれば、と思います。

大学院生は、基本的に1つの研究あたり目安として3か月で100本の論文(主にトップカンファレンスで発表された英語論文)をサーベイしてもらいますので、M1のどこかでサーベイの時間を取り、研究テーマについて考えてください。修士で入る前にやりたかったテーマを修士論文にする人はだいたい1/3程度です。おもしろそうな研究テーマはたくさんあります。しかし、短い修士の期間では、そのうち1つか2つくらいしかできません。大学院では「何をするか」より「何をしない(諦める)か」の方が重要になってきます。先輩の話を聞いたりサーベイをしたりすると、自分が少なくない時間をかけて取り組みたいと研究テーマが見えてくるので、ぜひ挑戦してもらいたいと思っています。(他大学の学生で、大学院で本研究室への進学を希望する人は、卒論・卒研のために論文を100本サーベイする、というのを意識してもらえたらと考えています)

B4で配属されてそのまま大学院に進学して修士で卒業する場合、大学院から首都大に来て修士で就職する場合、博士後期課程にも進学した場合、という3つのケースの典型的な研究サイクルについて書いてみました。また、同じような規模・体制のお茶の水大伊藤研究室の場合明治大学中村研究室の場合も参考になります。

研究テーマに関する問い合わせが多いので、問い合わせの多いテーマについて、見学(検討)すべき他大学についてまとめます。研究テーマに特にこだわりはないが、自分で自由に決めたい、という人は、NAIST 松本研あるいは東工大奥村・高村研をお勧めします。(ただし、松本先生はあと3年で定年なので、博士後期課程に進学する可能性のある人はご注意ください)

  • 深層学習: NAIST 松本研、東大鶴岡研、東北大乾・岡崎研、豊田工大佐々木・三輪研
  • 対話: NAIST 中村研、阪大駒谷研、京大河原研
  • ウェブマイニング: NAIST 荒牧研、阪大鬼塚・荒瀬研、京大森研
  • 機械翻訳: 京大黒橋研、NAIST 中村研

Q: 研究室見学はできますか?

A: はい、B4の研究室配属・大学院の受験生ともに、研究室見学をすることを強くお勧めします。特に、研究室に来てからは教員と過ごす時間は全体の1割程度で、9割は研究室で先輩・同期・後輩と一緒に研究をするので、学生室の雰囲気がどうであるか、ということをちゃんと見てほしいと思っています。

B4 の研究室配属の前は B3 後期に合計3回公式な研究室見学があります。大学院受験生に関しては4-5月にオープンキャンパス+公式な研究室見学があります。うちの研究室以外の他の研究室も検討している、という場合はこれらの公式な研究室見学を利用するとよいです。

また、うちの研究室の研究内容に興味がある、という学生は、いつでも見学を歓迎しています。基本的にはお昼のランチを小町と一緒に食べ、午後の勉強会(13〜16時)に参加してもらう、という流れです。勉強会は原則的に授業期間中しか開催されていないので、可能であれば長期休暇中に見学することをお勧めします。(ただ、帰省のついでやインターンのついでなど、長期休暇中でないと来られない事情もあるでしょうし、柔軟に対処したいと思います)

Q: 他の研究室と研究テーマはどう違うのですか?

A: 情報通信システムコースでもっとも研究テーマが近いのは石川研と高間研です(大学院入試で複数の研究室に興味がある人は、これらの研究室と迷うようです)。ソーシャルビッグデータ研究センターで 共同研究をしています。次に似ているのが山口研そして貴家研です(情報通信コースの学生で、研究室配属をどこにするか悩む人は、石川研・高間研に加えて貴家研・山口研と迷うようです。首都大以外から大学院の受験を希望する人は、研究テーマを割と絞り込んでいるので、貴家研とは迷わないようです)。

それぞれ共通点と相違点を挙げます。

石川研

  • 共通点: 検索エンジン、ウェブマイニングに関する研究をし、国際会議で発表している。Python を研究に用いている。
  • 相違点: 石川研は Twitter などのソーシャルメディアからの情報抽出応用の研究をしている(解析対象および出力が必ずしも言語とは限らない。たとえば、入力が GPS データ、出力が可視化でもよい。最近は月震のデータ解析など、ほとんど信号処理の研究も多い)。小町研は Twitter も含めたウェブテキストを解析する基礎的な手法の研究をしている(入力もしくは出力のいずれかは必ず言語。入力は、GPS データや画像データも用いることがある)。小町研は必ずしもビッグデータを扱わない。どちらの研究室も機械学習を用いるが、小町研の方が機械学習成分が高い。

高間研

  • 共通点: テキストマイニングやウェブ情報抽出に関する研究をしている。
  • 相違点: 高間研は主に可視化による分析支援・意思決定支援の研究をしている。小町研は言語データの解析の研究をしている(分析のために可視化することがある)。高間研はフロントエンド・ 小町研はバックエンド。高間研は Java (Weka) と Ruby を研究に用いている。どちらの研究室も機械学習を用いるが、高間研は教師なし学習(クラスタリング)、小町研の方が教師あり学習が盛ん。

山口研

  • 共通点: 対話システムの研究をしている。
  • 相違点: 山口研はロボットを用いた研究をしており、ハードウェアやセンサーを活用した研究をしている。アルゴリズムはフローチャートで書き下せるようなルールベースが主(プログラミングは Java が多い)。小町研はハードウェアやセンサーを用いた研究はしていない。小町研ではアルゴリズムは疑似コードで書き下せるような機械学習を用いるのが主(プログラミングは Python が多い)。また、山口研と違い、対話システムがメインの研究テーマではなく、小町研では対話は数多い研究テーマの中の一つ。

貴家研

  • 共通点: マルチメディアを対象とした情報理論的な手法を用いた研究をし、国際会議で発表している。
  • 相違点: 貴家研は画像・音声データを対象として、統計的手法を用いた研究をしている。パターン認識・信号処理。小町研は言語データを対象として、統計・ 機械学習手法を用いた研究をしている。小町研では音声データを直接は扱わない(元々は音声のデータでも、書き起されてテキストになったデータを用いた研究 はしている)。

2015年度は山口研・石川研とそれぞれ共同研究をしています。2014年度は石川研・高間研と合同でウェブマイニングに関する基礎勉強会を開催しました。また、大学院の期末評価は石川研、山口研・高間研とそれぞれ共同で研究しており、博士後期課程の学生の副査は山口先生・高間先生にお願いしたりし ています。ソーシャルメディア分析・ウェブ(データ)マイニングに興味のある人は、石川研究室・高間研究室も検討されることをお勧めします。

研究テーマはどれもつながっているので、入力あるいは出力に言語を使いたいか、あるいは応用的な研究がしたいか基礎的な研究がしたいか、といったと ころがポイントです。また、研究テーマに大きなこだわりがないのであれば、研究室のスタイル・ポリシーや雰囲気などで研究室を決めてよいでしょう。

また、情報通信システムコースでは、ほとんどの研究室では学生の研究テーマは研究室のテーマ(先輩がやった研究)の中から選択するスタイルのようです。うちの研究室は学部4年生の最初の半年〜1年だけは研究室のテーマ(正確には研究室の大学院生が考えたテーマで、必ずしも過去にやったことがあるテーマとは限らない)をやってもらいますが、大学院に進学してからは完全に自由に決めてもらっています。自由に研究がしたい人は、うちの研究室が合っていると思います(ただし、適切な研究テーマを自分で選択しなければならない、という意味で、言われたことをやれば卒業できるというわけではなく、むしろ厳しい環境であると言えます)。

2016年度は情報通信コースで最大(学生数22人)の研究室となりました(次に大きい研究室は学生数17人の高間研究室と石川研究室)。2017年度も最大の研究室となる見込みです。ちょっと 居室は狭く感じるかもしれませんが、和気あいあいと勉強・研究しているので、ぜひ研究室見学に来て在学生と話してみてください。

以下に研究室の関係を学部3年生の研究室見学希望のログから抽出したグラフを示します。詳細はこちらのエントリを参照してください。

進路について

Q: 経済的に不安なのですが、大学院に進学したほうがよいでしょうか?

A: はい。学部を卒業したらもうプログラミングなんて見たくもない、あるいはどうしても親に仕送りしなければならない、などの事情がないかぎり、修士(博士前期)課程への進学をお勧めします。エンジニアとしてプロダクト・サービスを作る、あるいはなんらかの形でデータを分析したりする職業に就きたい場合、日本ではほとんど理工系の修士号を取得していることが前提となっています。

在学中は日本学生支援機構から奨学金を借りることができ、大学院で借りる第一種の奨学金(修士は月50,000円または88,000円)であれば在学中の研究業績などにより、受給者のうち3割の人が全額あるいは半額免除になります。アルバイトにせいを出すくらいなら、研究成果を挙げるほうが割がよいかもしれません。うちの研究室では、博士前期課程で第一種奨学金の希望者はほぼ受給できています。

情報通信システム学域だと、筆頭著者としてだいたい論文誌1本あればほぼ免除、国際会議が1本あれば免除の可能性あり(2本あれば免除の可能性が高いが、1本だと他の業績次第)、といったところです。国内学会・研究会の発表のみではほとんど免除の対象にはなりませんが、本研究室は全ての大学院生に論文誌あるいは国際会議への投稿を義務付けていて(採否は問いません)、そういう意味では全員に免除の可能性がありますので、第一種奨学金を申請することをお勧めしています。(2015年度実績では、研究室で第一種奨学金を受給していた学生4人のうち、2人が免除に推薦、1人が免除補欠に推薦されました。2016年度実績では、同じく受給していた学生5人のうち、1人が免除に推薦、1人が補欠に推薦されました)

また、経済的に困窮している人に対しては、必要に応じて研究室で研究開発のアルバイトを斡旋しています(時給1,000円程度です)。必ずしも自分の研究テーマに関係していないかもしれませんが、広い意味で自然言語処理に関する実タスクに関わることができるので、開発経験を積むこともできます。基本的にはプログラムを書く、データを作る、サーベイするなどして、ソースコードを納品したり報告書を用意したり論文にまとめて投稿したりする、という内容です。これとは別に、2014年度からは全ての大学院生に RA または TA もお願いしています。RA は月3万円程度、TA は時給1,200円程度(1人あたり2時間 x 8回=2万円程度)です。RA は卒研生の面倒を見る、というお仕事です。

  • 2014年度実績: 研究室の学生10人中7人に対し、1人あたり年間12万円程度のアルバイト、3人の RA
  • 2015年度実績: 研究室の学生20人のうち8人に対し、1人あたり年間15万円程度のアルバイト、4人の RA
  • 2016年度実績: 研究室の学生22人のうち11人に対し、1人あたり年間30万円程度のアルバイト、4人の RA

決して多い金額とは言えませんが、支援対象の人数・金額ともに、日本の大学ではこれくらいが限界だと思います(海外と比較してはいけませんが、日本ではかなり出している方だと思っています)。これ以上の経済支援を本学ですることは難しいので、もっと都心で豊富にアルバイトがある東大や東工大(大岡山)に通うか、あるいは NAIST のように生活費の安い大学に通うことをお勧めします。

蛇足ですが、みなさんが働き始めたら年収400万円としても、おおざっぱに年間の労働時間2,000時間で換算すると時給2,000円です。学生のうちに少し自由になるお金があるのは嬉しいことでしょうが、アルバイトで(就職したら自由に消費できない)貴重な自由時間をお金に換えるのは大変もったいないです。大学院でアルバイトをする場合、その経験が自分の将来に役立つかどうか、もう一度考えてみてください。

Q: 卒業後はどのような進路がありますか?

A: 情報通信コース全体の傾向から言うと、学部生のうち6〜7割が大学院に進学し、進学者のうち8〜9割が首都大、1〜2割が他大学(主に東大・東工大)に行きます。情報通信コースの中でも情報系の研究室は、そのまま修士まで進学する人がほとんどです。小町研学部1期生の進路は進学2名・就職2名、学部2期生の進路は進学4名・就職0名、学部3期生の進路は進学3名・就職1名、学部4期生の進路(予定)は進学5名・就職0名です。

修士の学生はほぼ全員が就職します。小町研修士1期生の進路はほぼ全員ウェブ開発企業(起業含む)です。就職先は年によって人気の分野は変わるようですが、ウェブ開発、SIer、メーカーなどさまざまです。小町研修士2期生も進路は半数以上ウェブ開発企業です。ウェブ開発企業は就職活動の時期が早いため、M1の秋〜冬にかけてどこかの企業から内々定をもらった上で、少し気になっている企業も受けてみて、最終的に行くところを決める、というような感じみたいです。

自然言語処理を専攻する研究室の修士の学生は、だいたい Yahoo! や楽天などのウェブ開発企業に就職するか、あるいは NTT データ・IBM・野村総研などのいわゆる SIer として就職するか、あるいは NTT や富士通などの研究所に就職する人が多いようです。就職活動に関しては、ウェブ開発希望だとうちの研究室の学生はほとんど苦労しないようですが、メーカーや SIer 希望の人は本学では推薦されても割と落ちます(例えば、NTT データに首都大から6人推薦したのにウェブテストを通過したのは2人で、最終面接で2人とも落とされたり、ということがあります)ので、修士から大学を変えて、修士号を取得したら就職したい、という人は、大学推薦の数も多く、実際に就職で高く評価されている NAIST をお勧めします。

過去に研究室で修士号を取得した学生の主な就職先(2名以上)は以下です。

  • ヤフー株式会社

Q: インターンシップに行ってもいいですか?

A: はい、ぜひ行ってください。実際にしばらくの間研究・開発体験をするのはその後のキャリアを考えるのに大きく参考になりますので、小町は積極的にお勧めしています(自分自身、NTT研究所、Apple Inc.、Microsoft Research、Yahoo! JAPAN 研究所でインターンしてきました)。研究室にインターンシップの案内もよく届きますので、研究室内SNSに転送・紹介しています。ただし、行くなら最低2週間、できれば4週間以上、理想的には3ヶ月以上のインターンシップに行きましょう。2週間未満のインターンシップは企業見学以上でも以下でもないので、2週間未満のインターンシップに行くくらいなら、大学院で研究したほうがよいと思います。また、手続きを踏めば、大学院生は5日間以上のインターンシップを卒業に必要な単位にすることができます。

過去に研究室の紹介で学生が行ったインターンシップ先は以下のようなものがあります(個人で応募して行ったインターンシップおよび研究室の紹介でもアルバイト扱いのものは除いています)。

  • マイクロソフト(M2)
  • ホンダ・リサーチ・インスティチュート・ジャパン(M1 x 2)
  • トヨタIT開発センター(B4 / M1)
  • NTT 研究所(M1 x 2)
  • 富士通研究所(M1)
  • エン・ジャパン株式会社(B4 / M1)
  • 弁護士ドットコム(M1)
  • JX通信社(B4 x 4 / M1)
  • 株式会社富士ゼロックス(M1)

内部進学について

Q: 履修しておいたほうがよい授業はありますか?

A: 首都大のシステムデザイン学部生で自然言語処理を含む人工知能の研究をしたい場合、以下の科目を履修しておくとよいですが、必須ではありません。ただし、 太字にした科目は自然言語処理の基礎にあるにも関わらず、研究室配属後に独学するのが難しいので、履修しておくことを強くお勧めしておきます(機械学習に 関係しています)。また、「オートマトンと言語理論」「離散数学入門」「データ構造とアルゴリズム」「人工知能」「情報理論」「Webマイニング」は自然 言語処理と密接に関係しているので、言語処理に関心があるなら履修しておいたほうがよいです(研究室に配属されたあとでも、これらの科目の うち言語処理に関するところは復習しますので、ついていけないというほどではありません)。「応用プログラミング」と「ソフトウェア工学」はソフトウェア 開発に必要な知識を学ぶことができるので、言語処理専門でなくても、エンジニアとしての就職を考えているのであれば履修しましょう。3年後期に極めて重要 な講義がたくさんありますので、大学院に進学予定の人は卒業に必要な単位が充足されていても、以下の授業を履修することを検討してください(それでGPA が下がっても責任が取れないのが痛いところですが……)。

「情報応用通信数学」は「ラグランジュの未定乗数法」や関数の最適化に関する自然言語処理で必要な数学的基礎を身につけることができるので、履修す ることを強くお勧めします。同様に、「パターン認識と機械学習」も機械学習の学習アルゴリズムについて学ぶことができるので、もし小町研を希望する可能性 が高いのであれば、履修しておいてもらいたいです。(「情報通信応用数学」は1限の授業なので、「パターン認識と機械学習」のみ履修する、というケースが 多いようですが……早起きする価値はあると思います)

  • 理工系共通科目: 離散数学入門(2年前期)・確率統計(2年後期)・数値計算法(2年後期)
  • 1年次
    • 後期: 情報通信数学第一・プログラミング基礎第一
  • 2年次
    • 前期: プログラミング基礎第二・データ構造とアルゴリズム・オートマトンと言語理論
    • 後期: 情報通信数学第二・情報工学演習・知能情報処理
  • 3年次
    • 前期: 情報理論・応用プログラミング・Webマイニング
    • 夏季集中: ソフトウェア工学
    • 後期: 人工知能・パターン認識と機械学習情報通信応用数学・情報代数と符号理論・応用通信工学

余力があれば以下の科目も履修しておくとよいかもしれません。履修しなくても言語処理の研究にあまり関係ないでしょうが、言語処理やデータマイニングに関する仕事をするエンジニアになりたい場合、これらの基礎知識が役に立つでしょう。

  • 3年次
    • 前期: 確率統計工学・ソフトウェア工学・知的ネットワークシステム
    • 後期: オブジェクト指向プログラミング・データベース・ヒューマンコンピュータインタラクション
  • 4年次
    • 前期: 計算論

ただし、将来自分が情報系の研究室に行くか通信系の研究室に行くかまだ決めていない(どちらもありうる)という人も多いでしょうし、2年生のうちは 幅広く基礎的な科目を履修することをお勧めします。また、卒業に必要な単位として通信系の科目を12単位取得する必要があり、2年前期に配当されている 「回路理論」「電磁気学」「制御理論」といった基礎的な科目を全く履修していないと3年生以降の通信系の科目を履修することが困難になるため、科目は計画的に履修してください。

あと、小町が担当している科目を履修しなければならないということもありませんので、自分で勉強したい科目を勉強してきてください。研究するに当 たっては自分で独学できる能力も重要なので、講義を全部聞いて単位を取っておけばよい、と考えているよりは、なんでも貪欲に勉強する人のほうが向いている でしょう。たとえば Coursera で機械学習や自然言語処理、人工知能やデータ構造とアルゴリズムに関する授業を聞いてみて、おもしろいと感じる人はエンジニア・研究者の適性があると思います。自然言語処理を独習したい人のためにも参考にしてください。

Q: どのようにすれば小町研究室に配属されますか?

A: 小町のところで自然言語処理の研究をしたい受験生(高校生等)は、首都大学東京システムデザイン学部情報通信システムコースを受験してください。1-2年 生は南大沢キャンパスで他学部の学生と一緒に主に一般教養の授業を学びます(2年生から専門の授業が少しずつ始まります)。3年生からキャンパスを日野 キャンパスに移して、システムデザイン学部の専門科目を履修します。入学後の学部・コース変更も可能ですが、学部1年生から学部・コースに分かれて授業を 受けるので、最初から情報通信システムコースで入学するほうがスムーズに進学できます。

研究室配属には GPA と呼ばれる成績を用いるため、希望の研究室次第で1-2年生のうちからそこそこ高い成績を取っておく必要があるそうです。うちの研究室は配属に必要な GPA 最低点が高い年もあれば低い年もあるので、タイミング次第では入りにくいかもしれません(今のところ、GPA が3.0ある人はうちを希望すれば配属されていると思います)。そのため、うちの研究室に来たい、と思って学部を受験して入ってきても、GPA が低いと必ずしも入れない可能性はありますが、上記のように情報通信システムコースは高間研・石川研・山口研など人工知能関連の研究室は多数あり、致命的に GPA が低くなければ(GPA 1.0未満だと、あまり選択の余地はありません)、どこかには入れるようです。

内部進学の学生は筆記試験免除が1研究室4人までしか認められていないので、GPA で最下位の人は必ず一般選抜を受験する必要があることに留意してください。一般選抜は外部の人と同列なので、外部生のように TOEIC スコアによる足切りは行いませんが、TOEIC/TOEFL のスコアが低いと数学で挽回することができず、進学希望で大学院試験には合格しても、定員の関係で他研究室に行ってもらわざるを得ない可能性があります(うちの研究室志望の外部受験生の TOEIC 平均・中央・最低値は2015年の入試でそれぞれ710点・650点・640点、2016年の入試で725点・680点・620点でした。現実的には TOEIC 600点程度は必要です)。

また、高専からの編入も毎年若干ながらいるようですので、高専から来て希望することも可能です。高専から来る人は GPA が高めなため、配属の可能性は高いようです。都立産業技術高専からは推薦枠があります。国立東京工業高専からは推薦枠はありませんが、地理的に近いですし、(将来の受験生も含め)見学を歓迎しています。専攻科経由で大学院から入りたいという学生も歓迎ですが、博士後期課程に進学希望の人のみ受け入れているので、もし修士で就職希望の人は専攻科経由ではなく3年次編入で首都大に進学してください。

学部3年生向けに11月末〜1月上旬にかけて、合計3回の研究室公開を開催します。他の研究室も見た上で、特別研究(卒業論文)配属で小町研を志望するかど うか決めてください。1月末〜2月上旬ごろに配属希望の調査があります。配属に関しては定員(3〜5名)があります。上記の「他の研究室と研究テーマはどう違うのですか?」も参考にしてください。

Q: 他大学に進学希望なのですが、かまいませんか?

A: はい、かまいません。研究はどこかでつながっているものなので、進学先でも役に立つ力を身につけて行ってくれればよいと思っています。特に博士後期課程に進学希望の学部生は、他大学に行くことも積極的に応援したいと思います。ただし、基礎勉強会には参加してもらいたい(卒業研究のために必要)と思っており、基礎勉強会は8月頭まであることから、他大学の大学院入試の勉強(専門科目)が必要な人がうちの研究室を志望するのはお勧めはしません

また、筆記試験免除の出願は合格した場合本学に入学を確約できる場合に限りますので、他大学に進学希望かつ他大学に落ちた場合は研究室に残りたい場合、本学は一般選抜で受験してください。

Q: 修士には進学せず、就職予定なのですが、かまいませんか?

A: はい、かまいません。ただし、学部卒では基本的に研究職は採用なし、(自然言語処理や機械学習に関する)開発職も厳しいので、研究開発を仕事にしたいのであれば、大学院に進学することをお勧めします。日本では、学部卒の学生には専門性があると見なされていないようです(そもそも、研究室配属前に就職活動が始まるので、専門性を評価できるわけがありませんが)。あと、就職活動の如何に関わらず基礎勉強会には参加してもらいたい(基礎実験や応用実験のように、出席が必須)と思っており、4月1日までに内定が出ていない場合、基礎勉強会が終わって就職活動に本腰を入れられるのが8月以降になることから、就職希望の人がうちの研究室を志望するのはお勧めはしません

余談ですが、研究開発・技術職に就きたい場合は、学部で数カ月就職活動するくらいなら、その間も含めて研究をスタートさせ、M1のうちに学会発表やインターンシップに行き、修士で就職活動をしたほうが満足度の高い就職活動ができると思います。日本学生支援機構の奨学金の返還免除の可能性も上がります (2015年度の修士の修了生のうち、4人が第1種奨学金を受給しており、うち2人が返還免除者として推薦、1人が返還免除候補者として推薦されました)。

Q: 基礎勉強会に参加してみたいのですが、かまいませんか?

A: はい、かまいません。事前に小町まで連絡してください。ただし、B2の人は日野キャンパスで授業があるのは後期の水曜日(日野デー)のみで、午後は必修の基礎実験があるので参加できません(午前中は小町が担当する「情報工学演習」があるので、そちらに出てください)。B3の人は日野キャンパスで授業を受けますが、前期は火曜日と木曜日の午後は必修の応用実験があり、それ以外の日しか参加できません。B4 の人は研究室ごとに予定が違うと思いますが、研究室のゼミ等に影響のない範囲で参加してもらって結構です。

ちなみに、基礎勉強会の日程は研究室の学生のスケジュール優先で決めますので、参加したい基礎勉強会が授業等と重なっていても特に考慮はしません。また、研究室の学生には研究生も含め全員 Mac を貸与しますが、そうでない人は Mac(またはそれ以外の端末でもかまいませんが、基礎勉強会に参加するに当たって必要なプログラムが動く環境)を持参してください。プログラミング系の基礎勉強会への参加は端末の持ち込みが必須です。

ただ、人数があまりに多くなると研究室で開催できなくなるため、定常的に参加する人数が増えすぎてしまった場合、例えば B3 の学生だと GPA 3.2 以上(=早期卒業の要件)などとする可能性があることをご了承ください。それくらい GPA がある人であれば、基礎勉強会に参加してもうちの研究室に来るだけの GPA が維持できるでしょうが、GPA 3.0 未満の人だと基礎勉強会に出すぎて成績が下がると配属で希望できなくなる可能性があるためです(基礎勉強会についていくのは、結構大変だと思います)。

基礎勉強会ではない勉強会(進捗報告)を見学したい場合は、お問い合わせください。

博士前期課程について

Q: 他大学からの大学院進学ですが、大丈夫ですか?

A: はい、かまいません。入試は人文系出身の人でも十分合格できる形式なので、2016年の入試までは文系出身の受験生も含め、日本人学生は全員夏季入試には合格しています(ちなみに、うちに合格してNAISTに不合格になることは多々ありますが、逆のケースはこれまで聞いたことがありません。NAISTの入試の方が選抜が厳しいです。)。合格した上で NAIST など他大学に進学する人の方が多数派ですが、2014年度および2016年度は文学部(仏文・哲学)からの入学実績があります(合格実績は法学部出身者・経済学部出身者・教育学部出身者など、毎年あります)。冬季入試は夏季入試の合格辞退者数次第なので、文系出身かどうかどうかに関わらず、落ちます(だいたい英語か数学のどちらかが極端にできない場合ですが)。他大学から受ける場合は基本的に夏季入試を受けてください。

数学に関して、学部2年次終了程度の情報系の基礎知識(線形代数・微分積分)は未習であれば入試を受ける前に独学で補ってください(下記の「入試について」の中で、具体的な項目を書きました)。一方、研究に必要なプログラミング・機械学習(数学)・自然言語処理(言語学)の基礎知識(情報系の学部3年次以降で学ぶ内容)は研究室の中の基礎勉強会でカバーされます。入学後夏休みまで、 自然言語処理やプログラミングの基礎勉強会を毎週開催します(人文系の人でもなんとかなるように、複数のレベル・内容の基礎勉強会があります)。入学前に必要となる知識は、たとえば以下の「履修しておいたほうがよい授業はありますか?」に挙げてあるような科目を参考にしてください。

本学の大学院では情報系の基礎科目は開講されていないので、人文系出身の人を含め、理工系以外から情報科学専攻に分野を変えたい人には、奈良先端科学技術大学院大学情報科学研究科をお勧めしています。奈良先端大では基礎数学・プロ グラミングなど、基礎的な科目も開講されており、学部を持たない大学院大学なので、分野外から来る人は過ごしやすいです(逆に言うと、首都大の大学院の授 業は分野外から来る人のことは考慮されていません)。

また、一般的に自然言語処理を学ぶことができる大学を まとめました。漏れがあるかもしれませんが(異動に追従できなくなっているかもしれませんが)、大きなところは網羅していると思います。情報系の学部にいるけどいまいる学部には自然言語処理の研究室がない、という場合、これらの研究室もそれぞれお勧めできるところですので、どうぞご参照ください。

他大学からの受験(首都大の他のキャンパス含む)の場合、受験前に小町に連絡をください。一度研究室に来てもらって、研究テーマなどについて話してみたいです。


Q: 人文・社会科学系からの進学希望ですが、かまいませんか?

A: はい、かまいません。大学院入学試験の数学(理工系の大学2年生程度の微分積分・ 線形代数)がクリアできれば、研究に必要な基礎知識は研究室内で身に付くよう、自然言語処理とプログラミングと機械学習の基礎勉強会を開催しています。プログラミングに関しては入学試験ではチェックしませんが、できれば入学試験までに、そうでなくとも入学までには「プログラミングコンテスト攻略のためのデータ構造とアルゴリズム」の「基礎編」を独習しておいてください(情報系の学部学科では、学部2年相当の内容です)。また、入学前に 自然言語処理を独習したい人のために を見て、不足している部分は独習しておいてください。

あと、修士号を取得するためには20単位(10科目)の授業の履修が必要で、これに関しては NAIST より取得のハードルが高いと思いますので、不安な人は NAIST に行くことをお勧めします。

数学力およびプログラミング力の両方に課題があると判断した場合には、研究生として半年または1年間過ごしていただくことをご案内することがあります(博士前期課程の授業と基礎勉強会を同時に履修することが難しい場合があるためです)。基礎勉強会の状況によっては博士前期課程の受験をお断りしますし、受験を認めても合格しなかった場合は研究生は延長しませんので、ご了承ください(数学力、プログラミング力、英語力のうち2つに課題があり、3ヶ月集中的に勉強しても少なくもそのうちの1つに改善の見込みがない場合、進学しても学位取得が困難であることが予想されるためです)。

首都大は近くに国立国語研究所という日本語学関係の研究所があり、うちの研究室の学生は定期的にここでプログラミングのアルバイトをしています。長期的にやってもらえる人を優先して紹介しているので、博士後期課程に進学希望の人文・社会科学系の方の進学を歓迎しています。

Q: 博士には進学せず、就職希望なのですが、かまいませんか?

A: いいえ、修士からうちの研究室に来たい人は、原則として博士後期までの一貫課程として、博士後期課程に進学希望の人を受け入れる予定です。ただし、本研究室の基礎勉強会(2016年は NLP 100本ノック、NLP チュートリアル、Python Machine Learning、言語処理のための機械学習入門)相当のことを入学試験より前に済ませており、本研究室が第一志望の人(他大学と併願可ですが、合格した場合進学を確約できる場合)は博士後期課程に進学希望でなくても構いません(内部進学生は研究室の基礎勉強会に出席することによって、自動的に満たされます)。このあたり、受験希望者の能力と将来性を考慮し、個別の案件にて判断しているので、詳しくはお問い合わせください。

本研究室は1年目の前半の半年は大学院生の TA による基礎勉強会・後半の半年は最初の論文について大学院生のメンター(RA等)による指導を受け、2年目の前半は基礎勉強会の TA をして後半は自ら論文を書き、3年目以降は RA 等として新入生のメンターをする、というサイクルで成り立っているので、研究室を継続するためにはみなさんが TA/RA/メンター となる必要があることをご理解いただければと思います。言い換えると、M1 の後半には国際会議に論文を投稿し、修士を終える頃には(共著で構わないので)2本目の国際会議に投稿する、というようなサイクルで研究するというような人であれば、就職希望の人(M1とM2の2年間しか研究室に滞在しない人)も受け入れる、ということです。

小町の希望としては、経済的な事情から修士で就職するにしても、研究職志望で社会人博士等で博士号を取得したい人に来てほしいと思っています(お茶の水女子大学では、職場の理解も必須ですが、就職と同時に進学し、とりあえず休学しておく、というケースも珍しくないようです。)。在学中に受験すれば受験料と入学料が不要であり、入学してすぐ休学すれば授業料もかかりません。長期履修制度という、3年分の学費で最長6年間在学できる制度もあります。

就職活動については、他大学から首都大に来て修士の2年間で就職活動をするより、NAIST で2年間過ごして就職活動をしたほうが、一般的には苦労しないようです(奈良だと就職活動で交通費がかかると思う人もいるかもしれませんが、長期化しない 限りは大きく交通費はかからないようです)。実家から首都大に通える、都内開催の勉強会に参加したい(すでにしている)、卒研で自然言語処理や機械学習を使ったり独学やアルバイトで勉強している、他の研究室はありえず小町の研究室にどうしても来たい、などの事情がない限り、他大学から進学するなら、修士で就職することが確実な人は首都大より NAIST  の方が優れているので、NAIST を検討することを強くお勧めいたします。

Q: NAIST 松本研とどう違いますか?

A: 小町が NAIST 松本研出身なので、NAIST 松本研の文化を色濃く受けており、以下のような共通点と相違点があります。

共通点

  • 勉強会(=研究グループ)が主体の研究(→学生が勝手に立ち上げる勉強会も多数)
  • 学生が自分で研究テーマを決める(→最初の研究テーマは研究室のプロジェクトから選択してもよい)
  • 機械学習をベースとする自然言語処理の研究が主体(→言語学的な知識や分析に基づく言語資源構築も盛ん)
  • いわゆる文系出身者も歓迎している(→研究室の基礎勉強会が充実しており、自然言語処理の基礎知識はフォローアップ)
  • 世界トップレベルの研究を(目指して)いる(→大学あたりのトップカンファレンスでの発表論文数は NAIST が国内他組織に大差をつけて1位だが、1学生あたりのトップカンファレンスでの発表論文数はどちらの研究室も同程度)
松本研が優れている点
  • スタッフ数が違う(松本研の方が圧倒的にスタッフが多く、研究指導を綿密に受けられる→小町との相性がいい人は、特に気にならないかも?)
  • 博士後期課程の学生・留学生の数が違う(サーベイ量や知識による研究の厚みや多様性が違う→積極的に学外で武者修行する人は、特に気にならないかも?)
  • 計算機環境が違う(松本研の方が高性能な計算機を大量に使える→学生1人あたりで考えると、特に気にならないかも?)
  • 歴史が違う(松本研の方が20年以上の歴史があり、世界的にも著名→研究的には積み重ねがないので、今後の伸びしろは圧倒的にうちの研究室)
  • 経済的に違う(寮に入れれば月2万円で住居・電気代その他お釣りが来るし、TA/RA もある→経済的に困っていない人は、特に気にならないかも?)

小町研が優れている点

  • 大学の場所が違う(一応都内にあるので各種勉強会等に参加しやすい・通学しやすい→大学での研究・開発以外に興味がある人はドロップアウトするリスクが高まる)
  • 研究の仕方が違う(毎週30分は必ず小町が進捗報告を聞くので、全く成果が出ないということはない→実験結果を他人に見せたくない・原稿を他人に見せたくない人には向かない)
  • 研究室の雰囲気が違う(みんなでワイワイ勉強したり研究したり遊んだりする→グループ行動が苦手な人には全く向かない)
  • 企業との連携が違う(インターンシップやアルバイト、共同研究への参加を奨励している→やらない人にとってはメリットではない)
  • 今後が違う(小町は定年まであと20年以上あり、研究室として急成長中で、基本的に異動する予定もない→D 進する予定がなく、また企業でも特にウェブ業界など自然言語処理や機械学習の知識を行かせる分野に就職したいという訳ではない人には、メリットではない)

博士後期課程について

Q: 博士後期課程に進学してやっていける自信がありません。

A: 周囲に博士後期課程の学生がいないと、どのような生活をしているのかイメージができないかもしれませんが、だいたい修士の学生が2年かけてやる研究(=査読つき国際会議論文1本)を毎年やる(=3年間で査読つき国際会議論文3本)、という流れです。それができる人もいますし、できない人もいます。だいたい 博士後期課程に進学した学生のうち、1/3がストレート(あるいは短期修了)で博士号を取得します。1/3が何年か追加でかかって博士号を取得します(つまり、1本の論文に2年以上かかるとそうなります)。1/3はどうやっても博士号を取得できません(つまり、何年かけても論文が書けないとそうなりま す)。

NAIST 松本研は2016年は博士後期課程の学生が23人、博士前期課程の学生が24人いるようですが、割と抵抗感なく博士後期課程に進学しており、博士後期課程 に進学する人が身近にいれば、そんなに不安になるようなものではないようです。上記のように、必ずしも博士号をストレートで取れている人たちばかりではあ りませんし、博士号を取れない可能性も(修士号までと比べるとはるかに高い割合で)あります。しかし、それでも進学する人が少なくないのは、博士号取得に 時間がかかる、あるいは取れなかったとしても、就職できないわけではない、というのを見ているからです。

小町が博士後期課程の学生に期待するのは、博士号を取得してアカデミア(大学あるいは国立の研究所等)で教員・研究者として研究をする、ということではありません。そ れよりは、新しく自然言語処理や機械学習を用いて研究開発を行おうとしている企業に就職して、例えば人工知能研究所を率いるリーダーや研究開発グループの コアメンバーになって、世の中にインパクトを与えるような仕事をする、ということにチャレンジしてほしいです(特に、海外の企業に就職して海外で活躍する 人が出てきてほしいと思っています)。

博士号を取得した人、というのは、もちろんその分野の第一人者となるわけですが、それ以外の分野も必要とあれば自力で学び、問題点を発見し、必要な 人と協力して問題解決に当たる、という高い汎用的な能力を身につけた人です。その訓練として、毎年1本査読つき国際会議に通す、という目安(ペースメー カー)があるので、世界を支える、そして少しずつ変えていくような仕事がしたい人は、ぜひ挑戦を検討してもらえたらなと思っています。

Q: 博士後期課程に進学したいです。

A: はい、博士後期課程の希望者に関しては、全力でサポートしたいと思います(H27年度から博士後期課程の学生が2名、H28年度から4名在籍しています。H29年度には博士後期課程の学生が6名になる予定です)。他には東工大奥村・高村研究室あるいは NAIST中村研究室荒牧研究室も検討することをお勧めしています。

また、日本学術振興会特別研究員に採用されれば、3年(DC1)または2年(DC2)の間、月20万円のお給料をもらいながら研究することができま す。自然言語処理は学際的な学問であるため、採択率は割と高い方だと思います(自分が申請書を添削した人のうち、DC1またはDC2が取れた割合は9割程 度です)。首都大は、DC1 に申請した人を対象に、DC1 が不採択でも3年間(DC2 に採択されるまで)月15万円を給付する奨学金制度があります。学振 DC1 より高い確率でもらえる制度ですので、博士後期課程に進学希望の人は早めにご相談いただければ、経済的には多少余裕を持って学生生活を送るアドバイスがで きると思います。(上記のように、日本学生支援機構の奨学金も、本研究室では半分前後の人が返還免除になっています)

博士後期課程に進学しても、自然言語処理分野であれば、ストレートで博士号を取得できる人は企業を含めると就職には困らないので、心配無用です。た だし、博士号を評価してくれる(=博士号を取得したことによって、給料や仕事内容が変わる)企業は少なく、そういう就職先は主に研究所になります。自然言 語処理分野では狭義の研究をする(=論文を書く)ことを主要な業務とできる企業の研究所は日本では恐らく NTT コミュニケーション科学基礎研究所(言語処理関係は京都)および IBM Research - Tokyo の2カ所で、業務の一部に含めることが可能なのは NTT サービスイノベーション研究所(横須賀)、富士通研究所(横浜)、NEC研究所(川崎)、富士ゼロックスR&D(横浜)、楽天技研(東京)、 NHK技研(東京)、ヤフー研究所(東京)、豊田中央研究所(愛知)、ホンダ・リサーチ・インスティチュート・ジャパン(埼玉)といったところです。ま た、これら以外にも、東大・京大・東工大をはじめとする国立大学や国立情報学研究所(東京)や情報通信研究機構(NICT=言語処理関係は京都)、産業技 術総合研究所(言語処理関係は東京)のような国立の研究所で随時研究員の募集があり、どこにも就職先がない、という状況は極めて少ないです。

博士後期課程では日常的に査読付き国際会議の論文を読み、自らも投稿・発表することが必須ですので、プログラミング力だけではなく英語力も必須で す。博士号取得時には TOEIC 800点は超えているようにしましょう。博士後期課程在学中に、社会人博士などを除き原則として数ヶ月〜半年程度の海外インターンシップあるいは国際共同 研究に行ってもらうことにしています。

Q: 社会人博士は受け入れていますか?

A: はい、受け入れています。お気軽に小町にお問い合わせください。ちなみに、東京都在住の人は入学料が半額になります。また、3年で取得せずたとえば6年で 取得したい場合、3年分の学費で済む長期履修制度があります(2015年度、2016年度に利用実績があります)。

ちなみに、社会人修士も入試制度としてはありますが、卒業のために修論とは別に20単位(10コマ)の取得が必要であり、M1の授業期間は週3-4 日程度授業を受けに来る必要があります(あるいは M2 でも授業を取るなら、2年間で授業期間の週2-3日程度)。1年間の休職が可能な場合は、1年目に授業の単位数を揃えることで修士号の取得が可能ですし、博士後期課程に進学希望の人は修士号を1年あるいは1年半で取得する短期修了制度もあります(ただし、短期修了はストレートに修士号を取るよりはハードルが高いです)ので、博士前期課程への入学を希望される場合もご相談いただければと思います。

修士号を自然言語処理関連分野で取得されている場合は社会人博士として受け入れますし、そうで ない場合は研究生として1〜2年間滞在していただき、例えば言語処理学会年次大会あるいは情報処理学会自然言語処理研究会等で発表し、査読付き国際会議で発表する、といった研究のサイクルを1回体験していただいた上で、博士号取得を目指される場合は社会人博士として受け入れる、というような形がスムーズかと考えています。

短期修了や博士号取得に必要な要件等につきましては、個別にご相談ください。

外国人留学生について

Q: 留学生を受け入れていますか?

A: はい、優秀な留学生の進学を歓迎しています。過去に博士前期課程に1人在籍しました。2016年度は研究生が1名(文部科学省国費留学生で、2017年4月に博士後期課程進学予定)博士後期課程に1人在学しています。2017年にはさらに留学生が増える予定です。

研究テーマに関しては、自然言語処理のことを十分に調べている人の出願を希望します。留学生からもらうよくあるメールとして、研究室の研究テーマ一覧に書かれているテーマの一つを選んで「この研究がしたい」というメールをいただく場合がありますが、学部で履修した科目がどれも自然言語処理や機械学習・パターン認識等と全く関係なく、志望する(自然言語処理または機械学習に関する)研究テーマに関して独学した形跡が全くない方は、受験をお断りしています。ネットワーク、コンピュータアーキテクチャ、ソフトウェア工学などで卒論を書いた人、それらの科目を中心に履修している人はお断りする可能性が高いです。自然言語処理でなくても音声処理、画像処理、データマイニングなどで卒論を書いた人は歓迎します。

逆に、研究室の過去の研究テーマ一覧になくても、独学で「この研究がしたい」と思って色々調べてからメールをいただく場合は、大歓迎しています。

また、学術協定を結んでいる大学の人であれば、文部科学省国費留学生の大学推薦制度も利用できますので、お問い合わせください。

Q: 日本語の能力はどれくらいあればよいですか?

A: このページを読んでいる時点で、研究に必要な日本語能力は十分あります。

ただし、入学してから大学院の修士の授業はほぼ全て日本語ですし、研究室の基礎勉強会は日本語で行われるので、博士前期課程(修士)に入学する場合、日本語能力試験1級に合格する程度の日本語能力がなければ厳しいです。本研究室の修士に入学したい人は、基本的に日本語能力試験1級を取得しておいてください(資格がなくても、日本に来て2年以上経っている場合は、問題ないことが多いです)。

一方、博士後期課程は授業を取る必要がないので、日常生活が送れる程度に日本語ができれば良いです(その代わり、英語の能力が必須です)。基礎勉強会以外の勉強会(進捗報告)は、段階的に英語と併用にしていく予定です。とはいえ、研究室の雰囲気として、みんなでワイワイと勉強・研究・遊び(スポーツ、ゲーム、アニメなど)をする、という感じですので、日本語ができた方が楽しく過ごせると思います。

Q: 日本語ができれば英語はできなくても大丈夫ですか?

A: いいえ、英語も研究には必要です。自然言語処理では基本的に国際会議で最先端の研究成果が発表されるので、先行研究の調査をするために、英語の論文を読む能力が必須です。毎週国際会議の論文紹介を開催していますし、研究のサーベイ期間中には、毎週英語で書かれた論文(1本8〜10ページ)を10本(3ヶ月で100本)リストアップし、3本アブストラクトを含めてざっと眺め、1本は全体をしっかり読む、というサイクルが基本ですので、とにかく多読します。

論文は専門用語が頻出しますが、ほとんどは非英語ネイティブの研究者が書くので、文法自体は中学生レベルです。専門用語さえ身につければ、読解は難しくありません。半年も研究室にいると慣れると思いますので、あまり英文を読んだ経験がなくても、気楽に考えてください。

また、博士前期課程(修士)入試のときは日本語能力試験のスコアの提出は必須ではなく、日本人学生と同様、TOEIC または TOEFL のスコアの提出が必須です。H28年度入試からは、TOEIC 700点未満(あるいは TOEFL iBT 70点未満)の留学生は出願を認めません。TOEIC/TOEFL ではなく CET の4級(または6級)を保持している場合は、スコアをお知らせください(ただし、受験には TOEIC または TOEFL のスコアが必要です)。

研究生について

Q: 研究生を受け入れていますか?

A: はい、受け入れています(2015年度以降、研究室スペースに余裕がないので、研究生に座席を割り当てることができませんが、それでもかまわない、という方のみ受け入れます)。ただし、博士前期課程の受験を希望する人を研究生として受け入れるのは、日本人・留学生のいずれも、TOEIC 700点(TOEFL iBT 70点、CET-4 合格)以上の人に限ります。

留学生の場合、東京の日本語学校に通っている人は、大学院試験を直接受けてください。夏季の大学院入試に合格した場合は、翌年4月に入学するまでの間の半年を研究生として受け入れます。冬季の大学院入試を受験して落ちた場合、4月から9月まで研究生として受け入れます(夏季入試にも不合格だった場合は研究生を延長しません。合格だった場合は4月まで研究生を延長します。注意してほしいのは、本学は10月入学が存在しないので、この場合1年間研究生になる、ということです)。冬季の大学院入試を受験しない人は、4月からの研究生としては受け入れません。

日本在住経験がない人は、大学院試験を受験する前でも研究生としての内諾を出します(国内に保証人を頼める人がいない場合、小町が保証人になります)。海外から新しく日本に来る場合、10月入学の研究生の出願締め切りは6月、4月入学の研究生の出願締め切りは2月です。書類に小町の押印が必要なので、出願締め切りのじゅうぶん前にご相談ください。

2018年4月入学の博士前期課程入試は定員にほとんど余裕がありません。2018年4月に入学したい人は、2018年1月の冬季入試では定員が残っていない思いますので、2017年8月の夏季入試を受験してください。2017年8月の夏季入試を受験する人には、2017年10月から来日する研究生としての内諾を出します。合格した場合は2017年10月から研究生になれます。不合格だった場合、定員に余裕があれば研究生を許可しますが、2017年度は定員に余裕がない(つまり、冬季の試験には定員が残っていないので、冬季に受験できない)見通しなので、許可できません。もう一度冬季試験を受験してください(2018年の4月からの研究生は受け入れることができます)。

また、留学生で文部科学省国費留学生の第一次選考に通った方にも研究生としての内諾(許可)を出します。本学が第一希望でなくてもかまいませんが、文部科学省国費留学生の第二次選考に不合格だった場合は、研究生として来日することはできません。また、修士号をすでに取得していて、博士後期課程に進学したい場合は、文部科学省国費留学生でなくても研究生としての入学を許可します。

進学希望ではなく、学位取得を目的としない場合(企業で自然言語処理の知識が必要になって半年間勉強したい、または研究がしたくなったので1年間くらいかけて論文を書いてみたい、といったケース)も余裕次第で受け入れています。学位取得を目的としない場合は英語に関する要件はありません(ただし、日本人または日本在住が長い方に限ります)。別途お問い合わせください。

Q: 研究生と一般学生との違いはありますか?

A: 研究生も学生ですので、基礎勉強会を含め各種勉強会への参加に関して他の学生(大学院生、学部生)と同じですし、研究室としては区別しませんが、2017年度以降、研究生にはメインの学生室の座席を割り当てることができない見通しです。また、研究室以外の授業を履修することはできません。一方、研究生の修了時に研究報告書を提出することで、研究修了証明書の認定を行うことができます(提出しない場合は認定されません)。

一点注意しておきたいのは、本研究室で学生が学ぶのは教員とのやりとりからは1割程度で、残りの大部分は研究室の先輩、同期、そして後輩とのディスカッション(雑談含む)からです。研究室に来て研究を行う(これらの話に参加する)かどうかが重要であり、例えば基礎勉強会・進捗報告の日以外は研究室に来ないような人は、研究生・大学院生であっても学ぶ環境を十分に生かすことができません(学位取得に関しては、本人に実力があれば、研究室に来なくても取得できるでしょう)。

入試について

Q: 推薦入試はありますか?

A: はい、首都大が第一志望の場合は内部進学・外部進学いずれでも筆記試験が免除になる制度があります(過去に外部進学でも筆記試験免除を受け付け、入学した学生がいます)。また、筆記試験免除で合格した場合は、必ず希望する研究室に配属されます。筆記試験免除の出願が許可されるのは、合格した場合入学を確約できる場合に限りますので、他大学と併願するなら一般選抜で受験してください(一般選抜の場合は、必ずしも第一希望の研究室に入れるとは限りません)。

ただし、本研究室では原則として外部進学の人には筆記試験免除の申請を認めません。一般選抜を受験してください。他研究室は外部進学の人でも筆記試験免除の申請を認めていることがあるので、本学の筆記試験免除を希望される外部進学の人は他研究室に問い合わせください。

また、推薦入試ではありませんが、会社に在職のまま受験する場合は、社会人特別選抜制度があります(会社による推薦書が必要です)。社会人特別選抜の場合も、筆記試験は免除され、口頭試問のみになります。社会人特別選抜の申請を認めるのは、最低1年間の休職が可能(※社会人特別選抜は、在職のまま進学する制度ですので、退職予定の方は対象ではありません)な場合に限ります。社会人特別選抜の場合も、合格した場合は希望研究室に配属されます。

Q: 出願前に連絡をしなくてもいいですか?

A: いいえ、研究室の内部進学以外の受験希望の方は、出願前に小町まで連絡を取ってください。

募集要項に記載の通り、留学生特別選抜および社会人特別選抜の場合は、出願書類にそもそも指導教員のサインが必要です。一般選抜の場合、出願書類に指導教員のサインは不要ですが、出願前に連絡がなかった場合、出願を認 めないことがあります。出願前に連絡を取っていただき、原則として研究室見学(授業期間の場合は勉強会への参加)をしてもらっています。

また、大学院の合否と希望研究室は全く関係がありませんが、定員次第で大学院入試には合格しても希望の研究室には配属されない可能性があることをご了承ください(合格通知の後に、希望通りでない場合は、配属に関して連絡します)。博士前期課程の1学年につき、定員は内部進学者・外部進学者・留学生を含めて6+1名(6名が夏季、1名が冬季)の予定です(内部進学者が例年3-5名いますので、外部進学者の定員は2-3名程度です)。

Q: 他大学と併願してもかまいませんか?

A: はい、併願は歓迎です。本研究室が第一志望でなくてもかまいません。

ただし、自然言語処理以外の研究でも構わない、という人より、自然言語処理の研究がしたい、という人に来てほしいと考えています。そのため、原則として自然言語処理の研究をしている研究室にリストアップされている研究室(と自分の出身研究室)のみ併願を許可します。これ以外で自然言語処理の研究をしている研究室で併願したいところがあれば、ぜひご相談ください。(例えば東大の中山研との併願は許可します)

Q: 英語はどれくらいできればいいですか?

A: 博士前期課程(修士)の出願には英語能力試験のスコアが必須ですので、TOEIC または TOEFL を受験してください。点数が思わしくない人は、何回か受けるとスコアが安定して、最初に受けたときより100点以上スコアが上がることは珍しくありません。修士に入学したときと卒業するときで、TOEIC のスコアを +100 点することが目標です。

H28年の入試(2017年4月入学)から、外部受験の英語能力試験の基準点を設定しています。H29年の入試では、原則として夏季入試は TOEIC 650点(あるいはTOEFLの相当するスコア)未満の方、冬季入試は TOEIC 750点(あるいはTOEFLの相当するスコア)未満の方は受験をお断りします(2018年4月入学の定員が厳しいためです)。また、TOEIC 600点未満の方あるいはいずれの英語試験も未受験の方は、受験目的での見学をお断りします(受験目的でない見学は歓迎しますが、受験する場合は受験目的での見学をお願いしています)。

博士後期課程の入試には特に英語能力試験のスコアは必要ありませんが、博士号取得までに国際会議に論文を数本採択される必要があるので、英語で作文・発表できる能力は必要です(進学までに英語で論文を書いた経験があれば、問題ありません)。また、2016年10月から順次、研究室内の進捗報告はグループ単位で公用語を英語にしていく予定です(まず機械翻訳グループ)。

ちなみに TOEIC の平均点は 580点ほど(日本人平均は510点)です。研究室内では、内部進学の学生も学部を卒業するまで(修士進学時)に TOEIC 600点、修士を卒業するまで(博士進学時)に TOEIC 700点、博士を卒業するまでに TOEIC 800点を目標としています(例えば楽天は入社時までに TOEIC 800点が要求されます)。目安として、TOEIC 500点以下の人は論文を読むことが困難、600点以下の人は論文を書くことが困難、700点以下の人は会話することが困難です。

Q: 数学はどれくらいできればいいですか?

A: 過去数年分の問題が事務で配布されているので、入手して解いてみて7割以上できればよい(=英語が普通にできれば、数学によって不合格になることはない) です。

自然言語処理の研究で必要とされる数学とは多少異なりますし、そもそもやっていないと仕方ないので、人文系から出願する人の場合、できなくてもあまり気にする必要はありません。ただし、全然解けない場合は入学後に困るので、半分程度は解けるように勉強してきてください(知っている問題が半分解ける、という意味ではなく、全ての出題範囲のうち半分が解ける、という意味です)。数学に不安がある人は「プログラミングのための線形代数」「これなら分かる最適化数学」あたりを当たってみてください。

  1. 線形代数では、3x3程度の行列の固有ベクトル・固有値の計算、逆行列や行列式の計算、対角化などができることを想定しています。線形代数は大学1年生相当の範囲全てが対象になります。(人文系の人でも、これらが全てできればいいですが、できない項目がある人はできるようにしてから入学試験を受けてください)
  2. 微分積分では、初等関数(多項式、e、log、cos など)の微分、積の微分、合成関数の微分、偏微分などの計算ができることを想定しています。微分積分に関しては高校数学(理工系の大学受験レベル)の微分が理解できていればよく、微分方程式や積分は手がつかなくても構いません。(人文系の人でも、これらが全てできればいいですが、できない項目がある人はできるようにしてから入学試験を受けてください)

理工系出身で数学に興味が持てない自覚のある人は、自然言語処理という分野自体が向いていない可能性があるので、例えば「言語処理のための機械学習」をパラパラとめくってみて、それが理解できる程度の数学力があるかチェックしてみてください。

また、博士前期課程の社会人入試および博士後期課程の入試は英語のスコア提出や数学の試験はありません。

Q: プログラミングはどれくらいできればいいですか?

A: 入試の筆記試験ではプログラミング力は評価しません。ただし、研究室の基礎勉強会は、「プログラミングコンテスト攻略のためのデータ構造とアルゴリズム」の基礎編が(教科書を見てもいいので)解ける程度のレベルを身につけていることを前提とします(情報系の学部1-2年生で履修する内容です)。これが解けない人は、入学してから特に補習はしませんし、最初につまずくとそのまま挽回不可能になりますので、情報系出身でない人は入学前に自習してきてください。

プログラミングの経験がなく、数学力も不足している場合は、入学しても卒業することが困難だと思いますが、数学力が不足していてもプログラミングの経験があれば補うことが可能なので、人文系出身の人や社会人経験者で、アピールできるプログラミング経験があればお知らせください。大学院の合否に関してはプログラミング力は考慮できません(英語力と数学力で決まります)が、大学院に合格した上で研究室の定員のボーダーラインにいる場合、英語力・プログラミング力・数学力を総合的に判断します。

Q: 受かるかどうか、不安です。

A: 本研究室で過去3年間受験を許可し、夏季入試を受けた人は全員大学院には合格していますので、ご安心ください。夏季入試に関しては、理系出身の人は TOEIC 600点、文系出身の人は TOEIC 700点あり、数学が(理系、文系のくくりの中で)普通に解けるなら大丈夫です。

過去落ちた人は基本的に TOEIC 500点以下の人または数学が全然解けない人(「全然」とは、線形代数と微分積分を合わせて10問弱出題されて、3問程度しか解答できない状態を指します)で、2016年現在本研究室の受験を許可する人は英語力的には基本的に夏季の大学院入試には受かると思います(ただし、大学院の合格は研究室配属とは独立に判定されるので、大学院には合格してもうちの研究室の定員を超えている、ということはありえます)。数学に関しては油断すると落ちますので、数学をしっかり勉強してください。

冬季入試に関しては、TOEIC 700点あっても落ちることがあります(ありました)ので、受験を許可したからといって油断せず、数学をきちんと勉強してください。TOEIC 700点以上ある人が冬季入試で落ちた場合、研究生として半年在籍することを許可しています。夏季入試に合格した場合はさらに半年研究生を延長し、4月入学できます。ただし、研究生には奨学金等の経済支援はありません。

Q: 研究計画書には何を書いたらよいですか?

A: 入学してから取り組みたい研究内容について書いてください。ここで書いた内容を必ずしも入学後にやる必要は全くないので、自由に書いてもらえればよいです。ただし、面接ではこの研究計画書に基づいて質問されるので、提出する前にコピーを取って面接前にもう一度読み返すことをお勧めします(あるいは、研究計画書はコピーを貼り付けて提出してもいいので、最初から電子的に書きましょう)。

出願したら、小町に出願書類に同封した研究計画書を送付してください。本研究室が第一志望の場合は出願前でも送っていただければコメント・添削します。本研究室が第一志望ではない場合は添削しません(コメントはすることがあります)。本研究室が第一志望ではない場合、第一志望の研究室の大学の教員や学生(OG/OB含む)などに相談してください。

※NAIST 志望の方から NAIST の研究計画書の添削依頼を受けることが多々ありますが、一切お受けしていません。

基本的には、研究する能力があるかどうか、を見るために用います。どのようなスタイルで書けばいいか分からない人は NAIST の小論文についての記事など読んでみてください。

Q: 博士後期課程に進学する予定はありませんが、受験してもいいですか?

A: H30年度入試からは原則として博士後期課程に進学の可能性がある人のみ博士前期課程(修士)の受験を許可します。海外の PhD コースに進学希望という人でも OK です。判断に迷う場合、悩んでいる場合などは一度見学してください(いずれにせよ、受験希望者は全員見学してもらっています)。就職予定の人でも、卒業後しばらくしてから社会人博士課程に進学することを検討している、というようなケースの人は大歓迎です。

また、研究室では研究開発に関するアルバイト(含む共同研究)やインターンシップを奨励していますが、自分の研究そっちのけでアルバイトやインターンシップをしてよい、という意味ではありません。研究インターンシップ両方やりたい、というような人を歓迎します。

環境について

Q: 研究室はどのような感じでしょうか?

A: 小町の居室と学生室は建物が別です。学生室は2016年10月現在博士の4人(うち1人は社会人)と修士の12人と学部4年生の5人と研究生の1人の合計22人います。学生には1人1台 MacBook Air もしくは MacBook Pro、そして Thunderbolt Display もしくは Dell 24/27インチディスプレイが割り当てられ、基本的には自分のローカル環境で作業を行ないます。

他に、大規模計算・GPGPU計算用サーバとして、以下の計算機があります。GPU は1人1〜2枚使えます。

  1. GPU サーバ: Xeon E5-2660 v4@2.00GHz 14コアx2・256GBメモリ・SATA 12TBストレージ・Tesla P40 x2(GPU)+GeForce GTX TITAN X x4(GPU)
  2. GPU サーバ: Xeon E5-2660 v4@2.00GHz 14コアx2・256GBメモリ・SATA 12TBストレージ・GeForce GTX TITAN X x8(GPU)
  3. 大規模計算サーバ: Xeon E5-2697 v3@2.6GHz 14コアx2・512GBメモリ・SATA 16TB ストレージ・Tesla K40 x4(GPU)
  4. 小規模計算サーバ: Xeon E5-2640 2.00GHz 8コア x2・128GBメモリ・SATA 20TB ストレージ
  5. ワークステーション: Xeon E5-1620 v3@3.50GHz 4コア・96GBメモリ・SATA 6TB ストレージ
  6. ファイルサーバ: Dual-core Intel Core i3-4150 3.5 GHz・8GBメモリ・SATA 72TB ストレージ
計算機環境としては可能な限りストレスのないようにしたいと考えていますが、計算機でカバーできない部分は頭を使って研究をしてくれることを期待しています。

Q: コアタイムはありますか?

A: 平日は毎日研究室に来ることを原則としていますが、コアタイムは存在しませんので、好きな時間に来て好きな時間に帰ってください。ただし、小町が出勤するのは10時〜17時ですので、授業期間中(=勉強会のある期間)はこの時間帯には研究室に来てください(研究室滞在時間が30分でもかまいませんので)。また、授業期間中はほぼ毎日勉強会を開催するので、新入生は参加してください。ちなみに、新入生以外は、すでに出席したことのある基礎勉強会に再度出席する必要はありませんし、研究室2年目の人の最低限出席するゼミ(研究会・進捗報告・勉強会)は週3-4コマ(週3日は研究室に顔を出すように、あえて1日1コマ入れています)です。

ポリシーとしては「よく学びよく遊べ」で、勉強・研究でも、遊びでも、全力でやってもらえたらなと考えています。基本的に平日は毎日大学に来て、言語処理の研究するにせよ、プログラミングの勉強をするにせよ、就職活動の準備をするにせよ、漫画を読んだりゲームをしたり、哲学談義したりするにせよ、研究室のメンバーと楽しく過ごしてもらえればなと思っています。研究室に来たからといって研究が進むわけではありませんが、研究室に来ない人はほぼ確実に研究は進みません。研究が進んでいない場合、(昼間の時間に)研究室に来ていればなにかしらサポートできると思いますが、来ていないとどうしようもありませんので、家でも研究できる自信がある人(一度査読付き論文を書いたことのある人)以外は、研究室に来て作業することを強くお勧めします。

社会人博士の人の場合は、半年に1回の研究室ゼミ(研究会)での発表と、適宜研究の進捗状況に合わせた1:1ミーティング(Skype 会議可)をお願いする予定です。長期履修制度を利用される場合はこの限りではありません。

研究室の雰囲気に合うかどうか、というのは重要だと思いますので、可能な限り研究室内の勉強会を見学し、かつ在学生のみで話してもらえる機会を作りたいと思っています。小町や在学生の Twitter アカウント、ブログなども見て、どのような研究室か、ということを判断してください。


ą
Mamoru Komachi,
2016/09/01 2:26
ą
_MG_9209.jpg
(1559k)
Mamoru Komachi,
2014/02/02 21:55
ą
_MG_9231.jpg
(1665k)
Mamoru Komachi,
2014/02/02 21:43
ą
_MG_9233.jpg
(1835k)
Mamoru Komachi,
2014/02/02 21:48
ą
Mamoru Komachi,
2013/12/16 3:58
Comments