摘要:
机器经过阅读大量的words,将每个单词用vector表示,vector的dimension表达着这个单词的属性,意思相近单词,dimension就会呈现出来。vector就是word embedding。 为了表示每个单词之间有联系,用二维vector来表示单词。可以更直观的看出每个单词的所属的类 阅读全文
posted @ 2021-06-19 09:55
常给自己加个油
阅读(2529)
评论(0)
推荐(0)
摘要:
寻找数据集の奥义 根据CMU的说法,寻找一个好用的数据集需要注意一下几点: 数据集不混乱,否则要花费大量时间来清理数据。数据集不应包含太多行或列,否则会难以使用。数据越干净越好,清理大型数据集可能非常耗时。应该预设一个有趣的问题,而这个问题又可以用数据来回答。 去哪里找数据集 Kaggle:爱竞赛的 阅读全文
posted @ 2021-06-19 09:36
常给自己加个油
阅读(259)
评论(0)
推荐(0)

浙公网安备 33010602011771号