摘要: 〔KenLM〕〔kenlm的训练及使用〕〔图解N-gram语言模型的原理〕 先下载编译KenLM wget -O - https://kheafield.com/code/kenlm.tar.gz | tar xz # 7z最大压缩后 315K libboost-program-options-de 阅读全文
posted @ 2025-11-09 20:33 华容道专家 阅读(7) 评论(0) 推荐(0)
摘要: #include <cstdint> #include <string> #include <iostream> #include <locale> #include <codecvt> using namespace std; wstring utf8_to_wchar(const string& 阅读全文
posted @ 2025-11-09 17:29 华容道专家 阅读(5) 评论(0) 推荐(0)
摘要: “我能吞下玻璃而不伤身体”这句话的出处可以追溯到哈佛大学学生Ethan Mollick在1997年创造的一个名为“I Can Eat Glass”的项目‌。 这个项目的初衷是教会人们用非母语说一句简单而地道的话,以令母语者感到惊讶和尊重‌。 后来,这句话被哥伦比亚大学的UTF-8样本项目采用,并改进 阅读全文
posted @ 2025-11-09 15:12 华容道专家 阅读(17) 评论(0) 推荐(0)
摘要: 在term间Ctrl-Shift-C/V复制粘贴,有时产生大量尾空格。与其到处翻设置,不如让AI写个脚本: #!/bin/dash for f in $*; do sed -i.bak 's/[[:space:]]*$//' "$f" done 这点小事发个随笔的原因:-i和.bak间不能有空格。 阅读全文
posted @ 2025-11-09 12:40 华容道专家 阅读(7) 评论(0) 推荐(0)