学生募集

小町を指導教員にと考えてこのページを訪れてくれた人、どうもありがとうございます。東京都立大学システムデザイン学部情報科学科(システムデザイン研究科情報科学域)小町研究室は自然言語処理の研究をしています。情報系に限らず、他分野の学科(人文・教育系を含む)出身で自然言語処理分野の基礎・応用の研究をしたい人を広く募集しています。研究の分かる(できる)エンジニアを輩出することを目指しています。本研究室は言語(英語、日本語)に関する知識、プログラミングに関する知識、機械学習に関する知識のいずれかに優れ、最先端の研究を挑戦する開拓精神に溢れた人をお待ちしています。また、研究室のダイバーシティを高めたいので、様々なバックグラウンドのある方を歓迎します。

このページには内部進学生向け、外部受験(一般選抜、留学生特別選抜および研究生)に共通する内容を掲載しています。内部進学生と外部受験生向けの内容は以下に分けました。

2021年度入試(2022年4月入学)以降、在外研究のため当面外部受験者は受け入れない予定です。

研究について

Q: 好きな研究ができますか?

A: はい、好きな研究テーマをしてください。新しい研究分野を切り開くような研究テーマにむしろ積極的に挑戦してもらったほうが嬉しいです。

B4で配属された人は、夏休みまでの課題として研究室で用意した複数のテーマ(例えば機械翻訳、言語学習支援など)の中から1つを選択し、大学院生1名をメンターとしてつけ、8月まで取り組み、順調に行けば8-9月の NLP(自然言語処理)若手の会シンポジウムで発表してもらいます。そのテーマを特別研究まで継続するもよし、10月からは違うテーマにするもよし、自らおもしろいと思う研究に取り組んでください。

研究室配属された人数と国際会議に投稿した人数を以下に示します。学部生でも難関国際会議に通すのが珍しくないような研究室にしたいと考えているので、みなさんもどんどんバッターボックスに立ってもらえれば、と思います。以下はうちの研究室に配属された直近5年の学部生の卒研に関する記録です。

    • 2020年度: 4人中1人が国際会議で発表、3人が国際会議に投稿(2件は採択率44%のメジャーカンファレンスの学生セッションに採択、1件は論文誌に採択)

    • 2019年度: 4人中3人が国際会議に採択(うち1件はトップカンファレンスの学生セッション、1件はメジャーカンファレンスのフルペーパー)

    • 2018年度: 3人中2人が国際会議で発表(1件はトップカンファレンスの学生セッション)

    • 2017年度: 5人中3人が国際会議で発表(3件とも採択率39%のトップカンファレンスの学生セッション)

    • 2016年度: 5人中1人が国際会議で発表、1人が arXiv で公開

大学院生は、基本的に1つの研究あたり目安として3か月で100本の論文(主にメジャーカンファレンスで発表された英語論文)をサーベイしてもらいますので、M1のどこかでサーベイの時間を取り、研究テーマについて考えてください。修士で入る前にやりたかったテーマを修士論文にする人はだいたい1/3程度です。おもしろそうな研究テーマはたくさんあります。しかし、短い修士の期間では、そのうち1つか2つくらいしかできません。大学院では「何をするか」より「何をしない(諦める)か」の方が重要になってきます。先輩の話を聞いたりサーベイをしたりすると、自分が少なくない時間をかけて取り組みたいと研究テーマが見えてくるので、ぜひ挑戦してもらいたいと思っています。(他大学の学生で、大学院で本研究室への進学を希望する人は、卒論・卒研のために論文を100本サーベイする、というのを意識してもらえたらと考えています)

日本所属の言語処理トップカンファレンス論文 (2021年) では、東大・京大・東工大・東北大・NAISTに次ぐトップカンファレンス論文数となっていますが、これは研究室が積極的にトップカンファレンスに挑戦することを奨励しているためです。世界は思ったより近いです。みなさんも世界の舞台で戦いましょう。下記の2点は論文を書くときとても参考になります。

B4で配属されてそのまま大学院に進学して修士で卒業する場合、大学院から首都大に来て修士で就職する場合、博士後期課程にも進学した場合、という3つのケースの典型的な研究サイクルについて書いてみました。また、同じような規模・体制のお茶の水大伊藤研究室の場合明治大学中村研究室の場合も参考になります。

研究テーマに関する問い合わせが多いので、問い合わせの多いテーマについて、見学(検討)すべき他大学についてまとめます。(理工系出身で)研究テーマに特にこだわりはないが、自分で自由に決めたい、という人は、東工大奥村研をお勧めします。

    • 深層学習: 豊田工大佐々木・三輪研、東大中山研、東工大岡崎研

    • 対話: NAIST 中村研、阪大荒瀬研、名大東中研、東工大奥村研(船越研)、電通大稲葉研

    • ウェブマイニング: NAIST 荒牧研、東大喜連川研(吉永研)、京大森研

    • 機械翻訳: NAIST 中村研、NAIST 渡辺研、愛媛大学二宮研、同志社大田村研

    • 基礎解析: 東大鶴岡研、東大宮尾研、東大谷中研、京大黒橋研、早大河原研、東北大乾研、東北大鈴木研

Q: 研究室の雰囲気はどんな感じですか?

A: 小町が NAIST 松本研出身なので、NAIST 松本研の文化を色濃く受けており、以下のような特徴があります。

    • グループ単位で研究する(→具体的な研究の仕方は先輩に教わる)

  • 勉強会(=研究グループ)が主体の研究(→学生が勝手に立ち上げる勉強会も多数)

  • 学生が自分で研究テーマを決める(→最初の研究テーマは研究室のプロジェクトから選択してもよい)

  • 機械学習をベースとする自然言語処理の研究が主体(→言語学的な知識や分析に基づく言語資源構築も盛ん)

  • 世界トップレベルの研究(→大学あたりのトップカンファレンスでの発表論文数は NAIST が国内他組織に大差をつけて1位だが、1学生あたりのトップカンファレンスでの発表論文数はどちらの研究室も同程度)

  • 東京に大学がある(→一応都内にあるので各種勉強会等に参加しやすい・通学しやすい)

  • 企業とたくさん連携している(→インターンシップやアルバイト、共同研究への参加を奨励)

うちも数回見学し、NAIST に行くことを強く勧めて NAIST に進学した人が入試に関する記事を書いてくれています。研究室見学をして、在学生と直接話してみてください。

Q: 研究室見学はできますか?

A: はい、B4の研究室配属・大学院の受験生ともに、研究室見学をすることを強くお勧めします。特に、研究室に来てからは教員と過ごす時間は全体の1割程度で、9割は研究室で先輩・同期・後輩と一緒に研究をするので、学生室の雰囲気がどうであるか、ということをちゃんと見てほしいと思っています。(ただし、2020年度時点では新型コロナウイルスの感染拡大のため、オンラインでのゼミ参加をしてもらっています)

大学院受験生に関しては4-5月にオープンキャンパス+公式な研究室見学があります。うちの研究室以外の他の研究室も検討している、という場合はこれらの公式な研究室見学を利用するとよいです。

また、うちの研究室の研究内容に興味がある、という学生は、いつでも見学を歓迎しています。基本的にはお昼のランチを小町と一緒に食べ、午後の勉強会(13〜16時)に参加してもらう、という流れです。勉強会は原則的に授業期間中しか開催されていないので、可能であれば長期休暇中に見学することをお勧めします。(ただ、帰省のついでやインターンのついでなど、長期休暇中でないと来られない事情もあるでしょうし、柔軟に対処したいと思います)

Q: 他の研究室と研究テーマはどう違うのですか?

A: 情報科学科でもっとも研究テーマが近いのは横山研と高間研です。次に似ているのが小野研です。情報科学科の学生で、研究室配属をどこにするか悩む人は、横山研・高間研に加えて貴家研・小野研と迷うようです。都立大以外から大学院の受験を希望する人は、研究テーマを割と絞り込んでいるので、小野研とは迷わないようです。ソーシャルメディア分析・ウェブ(データ)マイニングに興味のある人は、うちではなく、高間研究室・横山研究室を検討されることをお勧めします。

他研究室と迷う人は、それぞれの研究室に進学した方がいいと思います。また、それぞれ研究室の学生から話を聞きましょう。高間研・横山研とうちの研究室は、ウェブ系の開発をしたい人が多いので、自由な雰囲気です。例えば卒論(修論)発表会に私服で来るのはこれらの3研究室の学生です(学会も、スーツで行くと浮きます)。小野研は信号処理分野なので研究発表はスーツです(どちらがいいというわけでもないので、自分がどちらが好きか、あるいは嫌じゃないかで選んでください)。

それぞれ共通点と相違点を挙げます。

横山研

    • 共通点: 検索エンジン、ウェブマイニングに関する研究をしている。

    • 相違点: Twitter や Flickr などのソーシャルメディアからの情報抽出応用の研究をしている(解析対象および出力が必ずしも言語とは限らない。たとえば、入力が GPS データ、出力が可視化でもよい)。小町研は Twitter も含めたウェブテキストを解析する基礎的な手法の研究をしている(入力もしくは出力のいずれかは必ず言語。入力は、GPS データや画像データも用いることがある)。どちらの研究室も機械学習を用いるが、小町研の方が機械学習成分が高い。主なプログラミング言語は JavaScript。横山研の主な活動先は DEIM や WebDB Forum。

高間研

    • 共通点: テキストマイニングやウェブ情報抽出に関する研究をしている。最近は論文作成支援をしているので、人工知能学会以外にも言語処理学会にも参加。

    • 相違点: 高間研は主に可視化による分析支援・意思決定支援の研究をしている。小町研は言語データの解析の研究をしている(分析のために可視化することがある)。高間研はフロントエンド・ 小町研はバックエンド。高間研は Java (Weka) と Ruby を研究に用いている。どちらの研究室も機械学習を用いるが、高間研は教師なし学習(クラスタリング)、小町研の方が教師あり学習(特に深層学習)が盛ん。高間研は国内発表(和文論文誌)重視、小町研は国際会議(メジャーカンファレンス)重視。

小野研

    • 共通点: マルチメディアを対象とした情報理論的な手法を用いた研究をし、国際会議や論文誌で発表している。

    • 相違点: 貴家研は画像・音声データを、小野研は音声・音響データを対象として、統計的手法を用いた研究をしている。パターン認識・信号処理。小町研は言語データを対象として、統計・ 機械学習手法を用いた研究をしている。小町研では音声データを直接は扱わない(元々は音声のデータでも、書き起されてテキストになったデータを用いた研究 はしている)。貴家研や小野研はトップカンファレンスに加え、論文誌(英語)も重視(ただし、トップカンファレンスの難易度は分野によって大きく異なります。機械学習や自然言語処理は、国際会議が論文誌並みに難しいです)。

研究室の公開期末評価(卒論・修論・博論の中間発表・最終発表会)は山口研・高間研と合同で行っています。

h-index(論文がどれくらい引用されているか)順に並べると、小野先生小町高間先生横山先生の順です。研究者生活が長ければ長いほど引用される論文が増える傾向にありますが、大体の傾向は掴めると思います。

研究テーマはどれもつながっているので、入力あるいは出力に言語を使いたいか、あるいは応用的な研究がしたいか基礎的な研究がしたいか、といったと ころがポイントです。また、研究テーマに大きなこだわりがないのであれば、研究室のスタイル・ポリシーや雰囲気などで研究室を決めてよいでしょう。

また、情報科学科では、多くの研究室では学生の研究テーマは研究室のテーマ(先輩がやった研究)の中から選択するスタイルのようです。うちの研究室は最初の半年〜1年だけは研究室のテーマ(正確には研究室の大学院生が考えたテーマで、必ずしも過去にやったことがあるテーマとは限らない)をやってもらいますが、大学院に進学してからは完全に自由に決めてもらっています。自由に研究がしたい人は、うちの研究室が合っていると思います。ただし、適切な研究テーマを自分で選択しなければならない、という意味で、言われたことをやれば卒業できるというわけではなく、むしろ厳しい環境です。

情報科学科の中でも最大級の研究室ですが、和気あいあいと勉強・研究しているので、ぜひ研究室見学に来て在学生と話してみてください。図書館にこもって一人で勉強・研究したいと考えている人には向かない研究室です。狭いスペースでホワイトボードを使いながら自由闊達に議論する雰囲気が好きな人に来てほしいと思っています。

進路について

Q: 経済的に不安なのですが、大学院に進学したほうがよいでしょうか?

A: はい。学部を卒業したらもうプログラミングなんて見たくもない、あるいはどうしても親に仕送りしなければならない、などの事情がないかぎり、修士(博士前期)課程への進学をお勧めします。エンジニアとしてプロダクト・サービスを作る、あるいはなんらかの形でデータを分析したりする職業に就きたい場合、日本ではほとんど理工系の修士号を取得していることが前提となっています。

在学中は日本学生支援機構から奨学金を借りることができ、大学院で借りる第一種の奨学金(修士は月50,000円または88,000円)であれば在学中の研究業績などにより、受給者のうち3割の人が全額あるいは半額免除になります(大学によりますが、だいたいそれぞれ1割と2割)。アルバイトにせいを出すくらいなら、研究成果を挙げるほうが割がよいかもしれません(ただし、期待値的には貸与される金額200万×20%=40万円くらいなので、確実にもらえるお金とは違います)。うちの研究室では、博士前期課程で第一種奨学金の希望者はほぼ受給できています。

情報科学域だと、研究業績が重視される(最終的には総合的に判断)のですが、筆頭著者としてだいたい論文誌1本あればほぼ免除(全額もしくは半額)、国際会議が2本あれば免除の可能性あり(3本あれば免除の可能性が高いが、2本だと他の業績次第)、といったところです。進学して業績が挙がるかどうかは分かりませんが、期待値を考慮して第一種奨学金を申請することをお勧めしています。免除に推薦された場合はほぼ確実に免除になります。補欠の場合は免除になることもならないこともあります。内部進学生の方が(学部時代の仕事が国際会議で発表されたりしていれば)有利ですが、外部受験生でも免除になったことはあります。以下はうちの研究室で直近5年の修士号を取得した学生の推薦実績です。1/3よりは免除の可能性が高いです。

    • 2020年度実績: 4人のうち、3人が免除に推薦

    • 2019年度実績: 4人のうち、2人が免除に推薦

    • 2018年度実績: 4人のうち、2人が免除に推薦

    • 2017年度実績: 5人のうち、2人が免除に推薦、1人が補欠に推薦

    • 2016年度実績: 5人のうち、1人が免除に推薦、1人が補欠に推薦

また、経済的に困窮している人に対しては、必要に応じて研究室で研究のアルバイト(時給1,300円程度)または開発のアルバイト(時給2,000-4,000円程度)を斡旋しています。必ずしも自分の研究テーマに関係していないかもしれませんが、広い意味で自然言語処理に関する実タスクに関わることができるので、開発経験を積むこともできます。基本的にはプログラムを書く、データを作る、サーベイするなどして、ソースコードを納品したり報告書を用意したり論文にまとめて投稿したりする、という内容です。これとは別に、2014年度からはほぼ全ての大学院生に RA または TA もお願いしています。RA/TA は半期(授業期間の4ヶ月)で12万円程度です。RA は後輩の面倒を見る、というお仕事です。以下は直近5年の研究室で雇用している学生の実績です。2021年度から2023年度までは、博士後期課程のフルタイム学生は全員 RA として採用し、月4〜12万円の経済支援を行うことにしました。また、2021年度から2023年度までは都立大のフェローシップ制度があり、学振 DC1 に申請して不合格だった場合でも月15.5万円の奨学金がもらえるチャンスが増えています。

    • 2020年度実績: 研究室の学生11人に対し、1人あたり年間25万円程度の研究室でのアルバイト、2人の RA

    • 2019年度実績: 研究室の学生10人に対し、1人あたり年間27万円程度の研究室でのアルバイト、3人の RA

    • 2018年度実績: 研究室の学生11人に対し、1人あたり年間33万円程度の研究室でのアルバイト、5人の RA

    • 2017年度実績: 研究室の学生12人に対し、1人あたり年間30万円程度の研究室でのアルバイト、6人の RA

    • 2016年度実績: 研究室の学生11人に対し、1人あたり年間30万円程度の研究室でのアルバイト、4人の RA

決して多い金額とは言えませんが、これ以上の経済支援を本学ですることは難しいので、経済的に困窮している人は、もっと都心で豊富にアルバイトがある東大や東工大、農工大や電通大に通うか、あるいは NAIST のように生活費の安い大学に通うことをお勧めします。(上記には研究室外でのアルバイトは書いていませんが、経済的に必要な人には企業での開発アルバイトを紹介しています)

蛇足ですが、みなさんが働き始めたら年収400万円としても、おおざっぱに年間の労働時間2,000時間で換算すると時給2,000円です(最近は人材争奪戦で囲い込みが激しくなっており、うちの学生でも修士卒で初年度750万円を提示されたりすることもあるようですが)。学生のうちに少し自由になるお金があるのは嬉しいことでしょうが、アルバイトで(就職したら自由に消費できない)貴重な自由時間をお金に換えるのは大変もったいないです。大学院でアルバイトをする場合、その経験が自分の将来に役立つかどうか、もう一度考えてみてください。

Q: 卒業後はどのような進路がありますか?

A: 情報科学域全体の傾向から言うと、学部生のうち7割以上が大学院に進学し、進学者のほとんどが都立大、数人が他大学(主に東大・東工大・NAIST)に行きます。小町研は進学率9割(卒研生29人中就職は3人のみ、進学者は全員内部進学)です。

修士の学生はほぼ全員が就職します。小町研修士1期生の進路はほぼ全員ウェブ開発企業(起業含む)です。小町研修士2期生も進路は半数以上ウェブ開発企業です。3期生以降は博士後期課程への進学者以外はほとんどウェブ開発・AI 開発・コンサルティング・SIer 等です。M1の秋〜冬にかけてどこかの企業から内々定をもらった上で、少し気になっている企業も受けてみて、最終的に行くところを決める、というような感じみたいです。

自然言語処理を専攻する研究室の修士の学生は、だいたい Yahoo! や楽天などのウェブ開発企業に就職するか、あるいは NTT データ・IBM・野村総研などのいわゆる SIer として就職するか、あるいは NTT や富士通などの研究所に就職する人が多いようです。就職活動に関しては、うちの研究室の学生はあまり苦労しないようです。ただし、修士に入学した人の進路として、内部進学生と外部受験生では進路が大きく異なります。外部受験生でストレートでスムーズに就職できた人は半分で、博士後期課程に進学した人もいますが、留年・休学・退学したり、在学中には就職先がどうしても決まらなかった人もいます(内部生は誰も留年・休学・退学したことはなく、卒業までに就職先が決まらなかった人もいません)。また、外部受験生は就職先も必ずしも自然言語処理や機械学習をする仕事に就くわけではありません。情報系にキャリアを変えたいという気持ちで修士の2年間だけ大学院に通いたい人は、NAIST に進学することを強くお勧めします。(内部進学生に限り、どうしても就職先を自分で決められなかったが、どこか紹介してほしい、という人には、就職先を斡旋しています)

過去に研究室で修士号・博士号を取得した学生の主な職場(2名以上)は以下です。

    • ヤフー株式会社

    • 楽天技術研究所

    • 富士フイルムビジネスイノベーション株式会社(旧富士ゼロックス)

    • 株式会社リクルートホールディングス

    • 株式会社ユーザローカル

Q: インターンシップに行ってもいいですか?

A: はい、ぜひ行ってください。実際にしばらくの間研究・開発体験をするのはその後のキャリアを考えるのに大きく参考になりますので、小町は積極的にお勧めしています(自分自身、NTT研究所、Apple Inc.、Microsoft Research、Yahoo! JAPAN 研究所でインターンしてきました)。研究室にインターンシップの案内もよく届きますので、研究室内SNSに転送・紹介しています。ただし、行くなら最低2週間、できれば4週間以上、理想的には3ヶ月以上のインターンシップに行きましょう。2週間未満のインターンシップは企業見学以上でも以下でもないので、2週間未満のインターンシップに行くくらいなら、大学院で研究したほうがよいと思います。また、手続きを踏めば、大学院生は5日間以上のインターンシップを卒業に必要な単位にすることができます。

また、インターンシップに行くのは研究室2年目に行くことをお勧めしています。1年目は自然言語処理の知識が不足していることが多いため、自然言語処理に関するインターンシップに行っても十分活躍することができないからです。自然言語処理とは関係ない一般的な開発のインターンシップであれば、特に関係ありませんが、自然言語処理の研究開発に関係しないインターンシップに行くことはお勧めしていません。

過去に研究室の紹介で学生が行ったインターンシップ先(2名以上)は以下のようなものがあります(個人で応募して行ったインターンシップおよび研究室の紹介でもアルバイト扱いのものは除いています)。

    • ホンダ・リサーチ・インスティチュート・ジャパン

    • トヨタIT開発センター

    • NTT 研究所

    • エン・ジャパン株式会社、株式会社インサイトテック

    • 弁護士ドットコム

    • JX通信社

    • 株式会社富士ゼロックス

大学院入試について

Q: 試験はいつありますか?

A: 大学院入試は夏季と冬季にあり、それぞれ8月、1月が試験日となります。毎年4-5月に大学院入試説明会がありますし、研究室見学はいつでも受け付けています(できれば研究室の勉強会に参加して研究室の雰囲気を体験してほしいので、長期休暇期間よりは授業期間の方をお勧めします)。

本研究室の博士前期課程は原則として夏季入試のみ受験を認めています。ここ数年は冬季入試では定員に達しており、受験を認めることができません。冬季入試の受験を希望する場合は、不合格の場合は研究生として進学する場合のみ受験を認めます。留学生の人はすでに研究生として在籍している人しか冬季の博士前期課程の受験を認めていません。

博士後期課程は夏季入試および冬季入試のいずれも受験を認めています。ただし、余裕を持って入学後の研究計画を準備したほうがいいので、早めの問い合わせをお勧めします。

Q: 推薦入試はありますか?

A: はい、都立大が第一志望の場合は内部進学・外部進学いずれでも筆記試験が免除になる制度があります(過去に外部進学でも筆記試験免除を受け付け、入学した学生がいます)。ただし、本研究室では外部進学者に対し、2021年11月現在、筆記試験免除での出願を認めていません(2021年度入試までは認めましたが、2022年度入試以降は筆記試験免除を含め、そもそも外部受験生を受け入れないためです)。

筆記試験免除で合格した場合は、必ず希望する研究室に配属されます。筆記試験免除の出願が許可されるのは、合格した場合入学を確約できる場合に限りますので、他大学と併願するなら一般選抜で受験してください。一般選抜の場合も、合格した場合は必ず第一希望の研究室に配属されます。

また、推薦入試ではありませんが、会社に在職のまま受験する場合は、社会人特別選抜制度があります(会社による推薦書が必要です)。ただし、現在は社会人特別選抜による出願は基本的に認めていません。

Q: 出願前に連絡をしなくてもいいですか?

A: いいえ、研究室の内部進学以外の受験希望の方は、出願前に小町まで連絡を取ってください。また、2021年11月現在、外部受験生の受験は認めていません。

募集要項に記載の通り、出願書類にそもそも指導教員のサインが必要です。出願前に連絡を取っていただき、原則として研究計画書のやり取りをしてから研究室見学(授業期間の場合は勉強会への参加)をしてもらっています。受験承諾書はスキャンしたものでもよいので、遠方からの受験の場合には必ずしも研究室見学や面談は必要ありませんが、研究計画書のやりとりをしたあとに Skype/Zoom/Google Meet 等で少し話してから受験承諾書を発行します。

Q: 定員はありますか?

A: はい、2017年度入試(2018年4月入学)以降は研究室の定員を設けています。また、冬季入試に関しては夏季入試で定員を満たす場合は募集しません(ほとんどの場合は定員を満たしています)。

博士後期課程の受験生は原則受け入れたいと考えていますが、仮に冬季試験を受けるにしても、夏季試験より前にご相談いただけるとありがたいです。

Q: 他大学と併願してもかまいませんか?

A: はい、併願していただいてかまいません。ただし、本学が第一志望である場合に限ります。東大、東工大、京大などは本学の合否が分かるより試験があとなので、それらの大学と併願する場合はご注意ください(出願することはかまいませんが、こちらが合格を出した場合はそちらを辞退してもらうことになります)。本学に進学しない外部受験生に大量に合格を出すと、真面目に4年間がんばってきた(他の研究室の)内部生が落ちることになってしまい、健全な大学運営ができなくなってしまうためですので、ご理解いただければと思います。また、NAIST の場合は NAIST の合否が先に分かりますが、NAIST の合否より本学の出願が先のため、NAIST に合格した場合 NAIST に進学する人は出願をお断りすることがあります(合否と研究室は関係ないのですが、合否ではなく出願を許可できる人数に定員がかかるためです)。

2018年以降、一般選抜でうちの研究室の定員に入る人は東大・東工大・京大・NAIST に合格するレベルの人です。つまり、研究室を選ばなければそれらの大学に行ける人です。それらの大学でも自然言語処理の研究室は人気なので、そちらに合格しても配属が希望通りに行かず自然言語処理をやれないなら意味がないから、本学に来て自然言語処理の研究がしたい、という人に来てほしいです。

環境について

Q: 研究室はどのような感じでしょうか?

A: 小町の居室と学生室は建物が別です。学生室は2021年11月現在2部屋あり、学生はどちらかの部屋に所属しますが、広い部屋で研究会・勉強会等を行なっています(2020年度は全ての活動はオンラインで行っています)。サーバ室はこれとはさらに別にあります。学生には1人1台 MacBook Air もしくは MacBook Pro、そして Thunderbolt Display もしくは同等の27インチディスプレイが割り当てられます。

他に、大規模計算・GPGPU計算用サーバとして、以下の計算機があります。GPU は1人1枚以上あります(下記のサーバとは別に、高間研究室のサーバに GPU を搭載させてもらって、10枚くらい使用できます)。3研究室の共同利用になりますが、メモリ 3TB の CPU サーバも利用できます。

    1. GPU サーバ: Xeon E5-2660 v4@2.00GHz 14コアx2・256GBメモリ・SATA 12TBストレージ・GeForce GTX 1080 Ti x8(GPU)

    2. GPU サーバ: Xeon E5-2660 v4@2.00GHz 14コアx2・256GBメモリ・SATA 20TBストレージ・GeForce GTX TITAN X x2 + Quadro RTX 8000 x6(GPU)

    3. GPU サーバ: Xeon E5-2630 v4@2.20GHz 10コアx2・128GBメモリ・SATA 9TBストレージ・GeForce GTX 1080 Ti x4+GeForce GTX TITAN X x2+Tesla K40 x2(GPU)

    4. 大規模計算(CPU+GPU)サーバ: Xeon E5-2697 v3@2.6GHz 14コアx2・512GBメモリ・SATA 9TB ストレージ・Tesla P40 x2 + Tesla K40 x2(GPU)

    5. 小規模計算(CPU)サーバ: Xeon E5-2640 2.00GHz 8コア x2・128GBメモリ・SATA 26TB ストレージ

    6. GPU ワークステーション: Xeon E5-1620 v3@3.50GHz 4コア・96GBメモリ・SATA 18TB ストレージ・TITAN RTX x2(GPU)

    7. ファイルサーバ: Dual-core Intel Core i3-4150 3.5 GHz・8GBメモリ・SATA 61TB ストレージ

計算機環境としては可能な限りストレスのないようにしたいと考えていますが、計算機でカバーできない部分は頭を使って研究をしてくれることを期待しています。

Q: 研究室は忙しいですか?

A: はい、最初の半年(4月上旬〜8月下旬)は忙しいです。研究室の時間割もご覧ください。コアタイムはありませんが、平日週4〜5日は、毎日16〜17時ごろには基礎勉強会がスタートし、18〜19時程度まで開催されます(南大沢に帰る連絡バスには間に合わないことも多いので、南大沢在住の人はご注意ください)。午前中は M1 の授業があり、TA および外部進学の新入生が授業を履修するため、午前中に基礎勉強会を開催できないのです(また、全ての基礎勉強会で課題が課されるため、どのみち1日3〜6時間程度は課題を解く必要があります)。

新入生に関し、4月から8月までは、平日(特に基礎勉強会のある16〜19時)にアルバイトを入れることは控えてもらっています(アルバイトの必要があれば夜間もしくは週末にするよう調整してもらっています。ただし、B4 の4〜8月までは、平日夜間にアルバイトをすることは全くお勧めしません。課題をたくさんやる必要があるためです)。8月もほぼフルで NLP 若手の会シンポジウムでの発表のために研究をします。その代わりに9月は研究室的にはお休みで、10月以降は平日に研究室に来る日は週3日(全体ゼミ、論文紹介、進捗報告)になるように調整しており、平日週1-2日程度研究開発に関するアルバイトをする学生もいます。

4〜8月にしっかり基礎を固めてもらえない場合、10月以降の研究に支障をきたします。明らかに基礎が足りていない人は基礎勉強会に2回目の参加をお願いすることがありますが、基礎勉強会は4月からしかスタートしていないため、ほぼ1年間を棒に振ることになりますので、ご注意ください。

基礎勉強会以降の学生について、授業期間中は週20時間程度研究に割いてもらうことをお願いしています。前期後期がそれぞれ15週間なので、年間500時間弱であり、一般的に仕事をすると年間2,000時間以上働くことになりますので、特に負荷が高いようにはしていません。長期休暇中にインターンシップに行くことも奨励しているので、あえて負荷を多すぎないようにしています(ただし、少なすぎるのも問題なので、授業期間中は毎週進捗報告をしてもらっています)。1年間以上論文の投稿をしていない人については、長期休暇中もインターンシップ等に行かずに毎週進捗報告をして大学での研究を進めることをお願いしています。

小町は学部から大学院まで親の仕送りなしに生活していましたが、下宿生で連日(例えば深夜まで、研究開発とは関係ない)アルバイトをして学費を稼がないといけない、という人がうちの研究室に来ることはお勧めしません。生活費が安く(光熱費等込みで家賃月1.5万)、RA や開発のアルバイトなども豊富な NAIST に進学することを強くお勧めします。

Q: コアタイムはありますか?

A: 平日は毎日研究室に来ることを原則としていますが、コアタイムは存在しませんので、好きな時間に来て好きな時間に帰ってください。ただし、小町が出勤するのは10時半〜17時ですので、授業期間中(=勉強会のある期間)はこの時間帯には研究室に来てください(研究室滞在時間が30分でもかまいませんので)。

また、新入生は4月中旬〜8月上旬は平日はほぼ毎日16〜19時の時間帯に基礎勉強会が入りますので、この時間はアルバイト等は不可です(加えて、GW 明けから9月上旬の若手の会シンポジウム発表までは研究をしますので、8月末までずっと忙しいです)。これ以外に研究室全員参加の勉強会が3コマ程度ありますし、基礎勉強会はそれぞれ同じくらいの時間は演習課題を解いたりする必要があります。内部進学の B4 の学生に聞くと、最初の4ヶ月はトータルで週40時間程度は自然言語処理に関する何かをするそうです(B3 の同時期の忙しさの2-3倍程度、と聞きました)。外部から来る M1 の人はこれに加えて週10時間程度授業があるので、かなり大変だと思います。最初の半年は覚悟してください。

ちなみに、新入生以外は、すでに出席したことのある基礎勉強会に再度出席する必要はありませんし、研究室2年目の人の最低限出席するゼミ(研究会・進捗報告・勉強会・論文読み会)は週3日で、合計週9時間前後です。それ以外の時間は各自研究等に充てます(いつどこでどのようにしなさい、と言うことはありません)。

ポリシーとしては「よく学びよく遊べ」で、勉強・研究でも、遊びでも、全力でやってもらえたらなと考えています。基本的に平日は毎日大学に来て、言語処理の研究するにせよ、プログラミングの勉強をするにせよ、就職活動の準備をするにせよ、漫画を読んだりゲームをしたり、哲学談義したりするにせよ、研究室のメンバーと楽しく過ごしてもらえればなと思っています。研究室に来たからといって研究が進むわけではありませんが、研究室に来ない人(特に新入生)はほぼ確実に研究は進みません。研究が進んでいない場合、(昼間の時間に)研究室に来ていればなにかしらサポートできると思いますが、来ていないとどうしようもありませんので、家でも研究できる自信がある人(一度査読付き論文を書いたことのある人)以外は、研究室に来て作業することを強くお勧めします。

社会人博士の人の場合は、適宜研究の進捗状況に合わせた1:1ミーティング(オンライン可)を実施しています。長期履修制度を利用される場合はこの限りではありません。

研究室の雰囲気に合うかどうか、というのは重要だと思いますので、可能な限り研究室内の勉強会を見学し、かつ在学生のみで話してもらえる機会を作りたいと思っています。小町や在学生の Twitter アカウント、ブログなども見て、どのような研究室か、ということを判断してください。(小町は研究室のことを割と赤裸々に書きますので、それが気になる人は向いていないと思います。どの程度赤裸々かはブログ等を例えば1ヶ月分程度見ていただければ分かると思います。)