やる気が出なかったのでほぼ寝る。加藤の配信を見る。 BertのTokenizationの仕様を確認する。当たり前ではあるが、事前学習時のwordpieceの分割を辞書に保存してそれを新しいデータが入ってきた時に使用している。
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。