摘要: 目标是算出v(w),即o(wh+b),h和b要提取字词信息 基本假设:某词所出现的上下文与该词有较高的corr CBOW:context(w)->w(用Linear(context(w))的平均值作为上下文信息,粗暴地使用one-hot直接评估 skip-gram:w->context(w) 原版都 阅读全文
posted @ 2025-01-31 23:31 Anticipator 阅读(17) 评论(0) 推荐(0)