2020-08-29 ねる やる気が出なかったのでほぼ寝る。加藤の配信を見る。 BertのTokenizationの仕様を確認する。当たり前ではあるが、事前学習時のwordpieceの分割を辞書に保存してそれを新しいデータが入ってきた時に使用している。