会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
TW-NLP 厚积薄发
博客园
首页
新随笔
联系
订阅
管理
2025年3月7日
开源最强中文纠错大模型,超越华为17个点!
摘要: 项目地址:GitHub - TW-NLP/ChineseErrorCorrector: 中文拼写错误和语法错误纠正 文本纠错任务在审查、写作任务中至关重要,以前的纠错大多采用小模型进行训练,例如BART、T5、BERT等,但是小模型的泛化性较差,需要在不同领域训练不同的小模型进行纠错,为此我们使
阅读全文
posted @ 2025-03-07 09:36 TW-NLP
阅读(1581)
评论(0)
推荐(0)
2025年2月18日
ImportError: /***/py38-office/bin/../lib/libgomp.so.1: cannot allocate memory in static TLS block
摘要: vim ~/.bashrc export LD_PRELOAD=/***/py38-office/lib/libgomp.so.1
阅读全文
posted @ 2025-02-18 15:05 TW-NLP
阅读(33)
评论(0)
推荐(0)
2025年2月11日
Terminal entry not found in terminfo 'screen.linux' not konwn,使用vim 后 上下左右变为ABCD
摘要: export TERM=xterm
阅读全文
posted @ 2025-02-11 14:10 TW-NLP
阅读(15)
评论(0)
推荐(0)
2024年10月12日
others
摘要: import cv2 import numpy as np import math # 原始图像路径 image_path = "path_to_image.jpg" # 读取原始图像 image = cv2.imread(image_path) # polygons 坐标 (左上、右上、右下、左下
阅读全文
posted @ 2024-10-12 15:29 TW-NLP
阅读(16)
评论(0)
推荐(0)
2024年9月25日
插入区间
摘要: 与上篇的合并区间类似,插入区间的描述是: 给你一个 无重叠的 ,按照区间起始端点排序的区间列表 intervals,其中 intervals[i] = [starti, endi] 表示第 i 个区间的开始和结束,并且 intervals 按照 starti 升序排列。同样给定一个区间 newInt
阅读全文
posted @ 2024-09-25 17:31 TW-NLP
阅读(44)
评论(0)
推荐(0)
合并区间
摘要: 对下面的区间进行合并, 实例如下: 输入:intervals = [[1,3],[2,6],[8,10],[15,18]] 输出:[[1,6],[8,10],[15,18]] 解释:区间 [1,3] 和 [2,6] 重叠, 将它们合并为 [1,6]. 解决问题的思路: (1)先将区间进行排序(按左区
阅读全文
posted @ 2024-09-25 09:23 TW-NLP
阅读(17)
评论(0)
推荐(0)
2024年9月19日
汇总区间
摘要: 给定一个有序的list, 需要根据数据的连续性进行区间的汇总 实例如下: 解决方法: 设置左右指针,固定左指针,当右指针对应的数+1=右指针+1对应的数 and 右指针不要越界,就移动右指针,直到跳出while,并更新左指针=右指针+1 class Solution(object): def sum
阅读全文
posted @ 2024-09-19 15:00 TW-NLP
阅读(14)
评论(0)
推荐(0)
2024年9月6日
中英文关键词抽取
摘要: 中英文关键词抽取 欢迎使用中英文关键词抽取工具,本工具支持多种关键词抽取算法,帮助用户从文本中快速提取重要信息。下图展示了我们所支持的关键词抽取算法: 介绍 本工具提供多种关键词抽取算法,满足不同需求。支持的算法如下: TF-IDF:通过词频和逆文档频率来衡量词汇的重要性。 TextRank:基于图
阅读全文
posted @ 2024-09-06 10:06 TW-NLP
阅读(256)
评论(0)
推荐(0)
2024年8月29日
哈希-快乐数
摘要: 解决这个问题的关键在于,判断结束遍历的条件,即当n!=1 或者 在循环过程中,没有出现过重复的数。 class Solution: def isHappy(self, n: int) -> bool: def get_score(n): sum_ = 0 while n > 0: end_ = n
阅读全文
posted @ 2024-08-29 09:39 TW-NLP
阅读(15)
评论(0)
推荐(0)
2024年8月22日
TF-IDF 算法原理以及源码实现
摘要: TF-IDF(Term Frequency-Inverse Document Frequency),是用来衡量一个词在文档中的重要性,下面看一下TDF-IDF的公式: 首先是TF,也就是词频,用来衡量一个词在文档中出现频率的指标。假设某词在文档中出现了( n )次,而文档总共包含( N )个词,则该
阅读全文
posted @ 2024-08-22 11:18 TW-NLP
阅读(1412)
评论(2)
推荐(0)
下一页
公告