1 2 3 4 5 ··· 1498 下一页
摘要: 为了面向未来,又装上fcitx5细细品了一下。转换正确率很高。 于是apt source fcitx5-pinyin看了下,发现两个2012年的文件: 1.4M 2012年12月 2日 py_stroke.mb 359K 2012年11月25日 py_table.mb 用这两个文件就能达到如此好的效 阅读全文
posted @ 2025-11-23 20:00 华容道专家 阅读(15) 评论(0) 推荐(0)
摘要: 点击Chrome工具栏上的截图—区域截图—编辑,就能写字,画箭头、框、线,缩放。 它不能改文字大小和字体。我这个很可以。多一个width: 1em,文字就竖着写了:玩法很多。添加后的文字可用鼠标拖拽,双击则隐藏。 还能裁剪图片。 HTML+JavaScript: <html><head><meta 阅读全文
posted @ 2025-11-23 13:12 华容道专家 阅读(3) 评论(0) 推荐(0)
摘要: 词库:addr computer food names sports agriculture chemistry construct machine physics beijing colleges economics music sifa (司法) sys (系统) 搞了个thin版,.deb 1 阅读全文
posted @ 2025-11-21 02:00 华容道专家 阅读(36) 评论(0) 推荐(0)
摘要: 比如 王二姐 的 拼音是 wangerjie ,查词典时用下列字符串都要能找到:werj wangerj werjie 我们可以建个这样的目录树:wang/er/jie,然后用shell提供的glob去找 w*/er/j* 下的 所有文件,其中一个叫 王二姐 。 ~$ md -p wang/er/j 阅读全文
posted @ 2025-11-18 00:46 华容道专家 阅读(8) 评论(0) 推荐(0)
摘要: 续之前的贴子,我们有了部精修词典,二至六字词共169872个。 foreach 词,用字的2-gram去检查首选是否正确,结果很差,可在〔这里〕下载 123094个不一样的。部分结果: 䴔䴖 交警 𫘝𫘨 抉剔 吖嗪 阿嗪 腌菜 言采 腌肉 眼肉 折光度 遮光度 折斤斗 辄筋斗 折腰步 这么不 折 阅读全文
posted @ 2025-11-16 00:53 华容道专家 阅读(7) 评论(0) 推荐(0)
摘要: 原书好像有段话调侃说:困惑度最大的好处是开组会方便,因为可以说:“我们把perplexity降低了多少”。 看书一向不仔细的我更困惑了:语言模型就是一堆概率啊。 语料一般划分为训练集和测试集两个集合,每个都由若干句子组成,训练集一般比测试集大得多。 困惑度一般用测试集计算。 问AI “举例说明如何计 阅读全文
posted @ 2025-11-12 12:38 华容道专家 阅读(8) 评论(0) 推荐(0)
摘要: 〔最新进展,有系统词典和用户词典了…〕 全部文件的行数 720 gb2312.utf8 这些是数据 16463 hz-py.utf8 2894733 slm.arpa 文本文件格式的语言模型 15 h.h 这些是程序 125 ime.cpp 109 pinyin.cpp 44 seg.cpp 17 阅读全文
posted @ 2025-11-11 16:31 华容道专家 阅读(35) 评论(0) 推荐(0)
摘要: import sys import requests from bs4 import BeautifulSoup as BS def get_links (url): links = [] try: r = requests.get(url); r.raise_for_status() # 失败抛出 阅读全文
posted @ 2025-11-08 09:20 华容道专家 阅读(10) 评论(0) 推荐(0)
摘要: 翁学天 (Xuetian Weng, CSSlayer),写了scel2org (fcitx-tools的一部分)。 我把他的.c程序挪了出来,不用装别的,gcc scel2org.c即可编译: 〔这里〕可下载 scel2org.c utarray.h uthash.h utils.h 补充:uth 阅读全文
posted @ 2025-11-08 00:13 华容道专家 阅读(6) 评论(0) 推荐(0)
摘要: 中文有多少词?多少词够用? ① 到〔灵格斯词典〕下载了成语词典、成语小词典、地名、诗词和文化词典, 用〔kdictionary-lingoes〕提取了文本文件。总计29,560个词条(未去重)。 ② googlepinyin和sunpinyin都是约6万词。 ③〔Gitee-pypinyin〕可以标 阅读全文
posted @ 2025-11-04 20:34 华容道专家 阅读(22) 评论(0) 推荐(0)
摘要: 简介 合并优化了多部词典,pydict_sc.bin 12M 20万词 用sunpinyin的统计语言模型工具训练了字的三元语法模型。训练语料为wiki+百科问答 lm_sc.t3g 12M 12298 items in 1-level, 740231 items in 2-level, 35283 阅读全文
posted @ 2025-11-02 20:59 华容道专家 阅读(16) 评论(0) 推荐(0)
摘要: 《莲花井》,作者: 阿·卡赞采夫、马·西亚宁 〔阅读〕 此碑文系太阳神祭司所刻。这堵墙后有一口圆形莲花井,边上有一块石头、一把刻刀和两根细长棍子。这两根棍子一根长3个度量单位,另一根为2个度量单位。如果将棍子一端抵住井的底角斜靠在井里,两根棍子正好在水面交叉,水面距离井底为1个度量单位。谁能用这两根 阅读全文
posted @ 2025-10-29 15:37 华容道专家 阅读(16) 评论(0) 推荐(0)
摘要: 网上许多trie施肥很足,比如C++版参数是string而不是const string_view&, Python版不用dict class TrieNode: def __str__(this): return str((id(this) - id(root)) // 64) def __init 阅读全文
posted @ 2025-10-27 23:25 华容道专家 阅读(5) 评论(0) 推荐(0)
摘要: 如题。烂代码分别如下: <pre style='display:none'> <img id=tile1 src='data:image/gif;base64,R0lGODlhMgA9APcAAAAAAAAMAAwMDAEUAQAaABMTExsbGwArAAAmAAA8AAA1AB8gHyIiIi 阅读全文
posted @ 2025-10-27 19:36 华容道专家 阅读(13) 评论(0) 推荐(0)
摘要: apt source libsunpinyin3v5 下载到当前目录下。 src/sunpinyin-dictgen是个有shebang的Makefile: #!/usr/bin/make -f W3M = wget -q -O - DL_LIST = https://sourceforge.net 阅读全文
posted @ 2025-10-27 19:25 华容道专家 阅读(15) 评论(0) 推荐(0)
摘要: const char* NM[][4] = { {"曹","贼","真","爽"}, {"西","施"}, {"昭","君"}, {"貂","蝉"}, {"甄","姬"}, {"玉","环"}, {"美"}, {"美"}, {"美"}, {"美&qu 阅读全文
posted @ 2025-10-27 08:23 华容道专家 阅读(86) 评论(0) 推荐(0)
摘要: $ a.out test init=ok search=34/34 candidate_num=157 dec=34 py2=shijiwentiyaodaoshijicainengjiejue $ a.out read successfully, lemma num: 65101 spelling 阅读全文
posted @ 2025-10-24 19:57 华容道专家 阅读(5) 评论(0) 推荐(0)
摘要: 输入: [1.000 2.000 3.000]输出: [ 3.464 -1.414 0.000]重建: [1.000 2.000 3.000] [0] cos(0.0*π/3)*sqrt(1/N)*1.0 + cos(0.0*π/3)*sqrt(1/N)*2.0 + cos(0.0*π/3)*sqr 阅读全文
posted @ 2025-10-19 19:18 华容道专家 阅读(13) 评论(0) 推荐(0)
摘要: #include <stdio.h> #include <stdint.h> #include <stdlib.h> #include <mmintrin.h> #include <pthread.h> #include <algorithm> /* 0 Q......Q 3 ..Q..... 4 阅读全文
posted @ 2025-10-19 15:57 华容道专家 阅读(7) 评论(0) 推荐(0)
摘要: 小时候在《科学画报》上看到过,不会。长大后会编程了,能做到试3!×3!×4!×4!次了,又发现手工可解。 先看手工:用个5x5的表格表示状态,行依次是:国籍、房子颜色、饮料、香烟、宠物。表格初始空白。 “挪威人住第一间房,挪威人住蓝房子隔壁,住中间房子的喝牛奶”: “绿房子在白房子左面隔壁,住绿房子 阅读全文
posted @ 2025-10-18 13:55 华容道专家 阅读(36) 评论(0) 推荐(0)
摘要: https://wiki.mnbvc.org/doku.php/1pb_store_plan_v1 GB 2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。该标准包含6763个汉字(其中一级3755个按拼音排序,二级3008个按部首排序)和682个 阅读全文
posted @ 2025-12-04 20:13 华容道专家 阅读(6) 评论(0) 推荐(0)
1 2 3 4 5 ··· 1498 下一页