wa007

2025年7月10日

摘要：用法使用 hf-ms-transfer 迁移 Huggingface 模型、数据集到 modelscope 平台：安装 pip install hf-ms-transfer # install 迁移 hf-ms-transfer "hf-user/hf-package" --ms-token " 阅读全文

posted @ 2025-07-10 11:36 wa007 阅读(347) 评论(0) 推荐(0)

2021年10月1日

table_test

摘要： title1 title2 key1 key2 阅读全文

posted @ 2021-10-01 11:16 wa007 阅读(18) 评论(0) 推荐(0)

2021年8月22日

word2vec

摘要：介绍 cbow：上下文词向量求和，预测中心词 skip-gram：中心词预测上下文优化 1、哈夫曼树把常规的 softmax 优化为哈夫曼softmax，优化的是每个样本在哈夫曼树上的路径概率与样本无关。 2、负采样对每一个正样本，按照词频构建负样本，构建二分类任务，梯度下降求解。可以用阅读全文

posted @ 2021-08-22 22:28 wa007 阅读(48) 评论(0) 推荐(0)

Glove

摘要：基本概念考虑 \(w1\) 和 \(w2\) 的共显频率，构建向量拟合共显频率，loss函数如下 \[ \sum_{w1,w2}{F(X_{ij})(w_i^T\hat{w_j} + b_i + \hat{b_j} - log(X_{ij}))^2} \] 最原始版本为单样本训练，即 bach_s 阅读全文

posted @ 2021-08-22 15:32 wa007 阅读(128) 评论(0) 推荐(0)

2021年7月27日

新词发现

摘要：新词发现定义新词发现就是识别特定预料中不在字典中的词，所以新词又被称为「未登录词」，比如微博语料中的网络流行语，黑产语料中的黑话。一般的做法是不依赖字典做无监督分词，分好的词减去已知字典，得到的就是新词。这样新词发现就被转换为分词任务，或者说是一个识别预料中的词的任务。下面介绍几种基于统计的阅读全文

posted @ 2021-07-27 10:17 wa007 阅读(626) 评论(0) 推荐(0)

隐马尔可夫模型

摘要：隐马尔可夫模型马尔可夫性质：存在一个状态序列，未来的状态只与当前的状态相关，而不与历史状态相关以每天的天气为例，明天的天气只与今天的天气相关，不与昨天、前天的天气相关。马尔可夫过程：一个具备了马尔可夫性质的随机过程，与马尔可夫链的概念较像隐马尔可夫模型：含有隐含参数的马尔可夫过程，包含两个等阅读全文

posted @ 2021-07-27 10:16 wa007 阅读(269) 评论(0) 推荐(0)

2021年4月23日

词向量训练

摘要： 1、fast text 利用英文的每个字母，生成Embedding vector 2、w2v：predicttive model 2.1、cbow 用周围词预测当前将C个周围词的onehot向量求和，乘以输入Embeding矩阵，变成C个周围词的隐藏层表示；再乘以输出Embeding的转置，变回阅读全文

posted @ 2021-04-23 09:34 wa007 阅读(366) 评论(0) 推荐(0)

2021年3月26日

TPU尝试

摘要： XDA device XDA 使用"惰性"机制的，类似pyspark的惰性机制，太难debug了，遂弃坑。一个demo，是可以成功运行的，且可以打印出中间结果。https://www.kaggle.com/hzp007/vision-transformer-vit-tutorial-baselin 阅读全文

posted @ 2021-03-26 10:44 wa007 阅读(66) 评论(0) 推荐(0)

2021年2月17日

优化器

摘要：梯度下降 https://zhuanlan.zhihu.com/p/32626442 SGD 原始的梯度下降算法：对参数减去当前参数的负梯度动量算法梯度=上一次的梯度和当前梯度的加权和优点：减少收敛过程中的震荡，使得收敛过程更加平滑，能加速收敛过程。 Nesterov 比Momentum更阅读全文

posted @ 2021-02-17 18:06 wa007 阅读(134) 评论(0) 推荐(0)

2021年2月13日

AtCoder Regular Contest 112 (3 / 6)

摘要： A、A - B = C 题目：给定L、R，求问存在多少个A、B、C三元组，使得A=B+C，其中L <= A <= R, L <= B <= R, L <= C <= R 答案：针对一个固定的A，存在满足条件的（B、C）两元组的数量为 A - 2 * L + 1，所以当你遍历A时，答案为一个等差数列，阅读全文

posted @ 2021-02-13 23:01 wa007 阅读(296) 评论(0) 推荐(0)

公告