2024年4月18日
摘要: 一、引言 可解释性代表的是一种以人类能够理解的方式解释模型行为的能力。 拥有可解释性有两个好处:①可解释性可以以人类能够理解的方式来很好的解释模型预测背后的原理,使普通人可以理解LLM的能力、缺陷。②对于研究者来说,可解释性可以帮助识别出偏见、风险和一些性能改进的领域。 二、LLM的训练 下游微调范 阅读全文
posted @ 2024-04-18 16:59 小黑哈哈 阅读(6) 评论(0) 推荐(0) 编辑
  2024年4月15日
摘要: 1.一篇很好的关于自监督学习的讲解:https://zhuanlan.zhihu.com/p/108906502 2.大模型需要的算力:https://zhuanlan.zhihu.com/p/672573246 3.微调分为全参微调和高效参数微调 阅读全文
posted @ 2024-04-15 22:24 小黑哈哈 阅读(2) 评论(0) 推荐(0) 编辑
  2024年3月14日
摘要: 论文1:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models (ICLR) 思维链是一系列导致最终输出的中间自然语言推理步骤,我们将这种方法称为思维链提示。 作者在算术、常识和符号推理上进行了实验,表明思维链提示优 阅读全文
posted @ 2024-03-14 21:36 小黑哈哈 阅读(7) 评论(0) 推荐(0) 编辑
  2024年3月6日
摘要: 论文1:Causal Reasoning and Large Language Models: Opening a New Frontier for Causality文章根据LLM在因果发现、反事实推理和实际因果关系方面的评估结果表明,它们可以取得很好的效果,这是通过大量的文本训练模仿该领域知识模 阅读全文
posted @ 2024-03-06 15:28 小黑哈哈 阅读(10) 评论(0) 推荐(0) 编辑
  2023年12月20日
摘要: 在用overleaf写论文的时候,引用完文献编译完之后发现 解决方法: 加一个\bibliography{bib文件}即可 阅读全文
posted @ 2023-12-20 10:27 小黑哈哈 阅读(413) 评论(0) 推荐(0) 编辑
  2023年12月14日
摘要: 由于服务器重装了系统,因此cuda版本和ubuntu系统版本也换了,不得不重装系统,导致以前可以正常运行的代码出了各种故障(注:现在的ubuntu版本是18.04,cuda版本是11.3) AttributeError: Can't get attribute 'DGLGraph' on <modu 阅读全文
posted @ 2023-12-14 20:17 小黑哈哈 阅读(281) 评论(0) 推荐(0) 编辑
  2023年3月30日
摘要: 在训练模型时,出现这个错误提示。发现时在导入jieba时,jieba需要一个缓存区,里面默认设置的是根目录home,但是这个目录没有权限进去,所以更改了cache目录,一开始是进入jieba的init文件中修改temp_dir,发现无效。 经过检查,发现在导入jieba的时候就已经设置了cache目 阅读全文
posted @ 2023-03-30 11:36 小黑哈哈 阅读(109) 评论(0) 推荐(0) 编辑
  2023年3月8日
摘要: 344. 反转字符串 class Solution { public: void reverseString(vector<char>& s) { for(int i = 0, j = s.size()-1; i < j; i++, j--){ char tmp = s[i]; s[i] = s[j 阅读全文
posted @ 2023-03-08 22:52 小黑哈哈 阅读(75) 评论(0) 推荐(0) 编辑
  2023年3月7日
摘要: 454. 四数相加 II class Solution { public: int fourSumCount(vector<int>& nums1, vector<int>& nums2, vector<int>& nums3, vector<int>& nums4) { unordered_map 阅读全文
posted @ 2023-03-07 22:09 小黑哈哈 阅读(678) 评论(0) 推荐(0) 编辑
摘要: 3. 无重复字符的最长子串 class Solution { public: int lengthOfLongestSubstring(string s) { unordered_map<char, int> map; int ans = 0; for(int start = 0, end = 0; 阅读全文
posted @ 2023-03-07 15:18 小黑哈哈 阅读(9) 评论(0) 推荐(0) 编辑