生産性を上げるための日記

1週間で3日稼働することを目指す

やりたい研究とは

先週1週間で稼働は3日。ちょっと少ないがまあいいか。やりたくないことを避けているだけで研究関係の話題や技術動向なども追っているのでまぁよし。できれば4日あると良い。

 

研究について色々悩む。

この世界で生き残るのが目的なのか、やりたい研究をやるのが目的なのか、この2つは相容れなく、大体はどちらかを立てるとどちらかが立たない。前者を目指してる人が多いからSoTa争いを続けているのだと思うが、果たしてそれは意味があるのか。10年後に読まれる論文なのか(2年後に読まれるかすら危ういと思う)。

SoTa争いは真理解明を置いてKaggleみたいにデータにいかにフィットさせるかのように思えてくる。技術開発は重要だと思うが、それと自然言語の解明とは隔たりがある気がしてならない。

データにフィットするモデルを開発することは自然言語理解につながるという主張がよくあるが、それは理解できない。実際、指標が1ポイント上がって言語理解の何が解明されたかを明らかにしている論文なんてほぼない。例えば機械翻訳をとると、本当はいかに人間の翻訳に近づけるかを議論すべきはずなのに語彙の扱い方をうまくするとか、マイナーアップデートを続けているだけのように見える。それはデータセット内での解決にはなっているかもしれないが、”翻訳”行為自体の解明にはなっていない。大きい、解決すべき目的を無視して機械的に解けるサブタスクの解決のみに終始している感がある。語彙をうまく扱うモデルを開発しましたという研究はそれはそれで大切だが。

トラックを分けるべきなのかな。データフィットトラックと自然言語理解トラックに。一緒にしてるから目的がよくわからなくなる(あと、あるデータセットを対象にしているだけなのに”要約”を改善しましたとか主語を大きく取る書き方もよくないと思う)。

という自分もモデル構築の研究はしていきたい。やれないのとやらないのは違うし、知識として、また仮説を検証する道具として必須である。

 

今日は日程変更されていたバイトのミーティング。恙無くおわる。

やはり自分発信の研究ではないので口籠る。ドメイン知識が乏しいので正しく言おうとするとどうしても小さいロールバックや訂正が入るのはしょうがない。モチベーションも詳しくは語れないし歯切れが悪い。割り切るしかない。

しかし、いままでで発表した中で感触は一番よかった。純粋にNLPタスクなので突っ込みやすいしわかりやすいと思う。

 

その後は 追加実験のための先行研究を調べて1時半に寝た。(翌0時に起きた)

 

人と交流していなくて寂しい。深夜に発狂しそうになった。