会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
SFTSGLY的博客空间
海内存知己,天涯若比邻。
首页
管理
上一页
1
2
3
4
5
6
下一页
2024年6月23日
FEDERATEDSCOPE-LLM A COMPREHENSIVE PACKAGE FOR FINE-TUNING LARGE LANGUAGE MODELS IN FEDERATED LEARNING
摘要: 1、文章贡献 (1)FS-LLM 将来自不同领域、异构程度可调的各种联邦微调数据集和一套相应的评估任务打包在一起,形成一个完整的流程,用于在 FL 场景中对联邦微调 LLMs 算法进行基准测试。 (2)FS-LLM具有低通信和计算成本的特点,可以让客户端不用访问完整模型也能满足需求 (3)FS-LL
阅读全文
posted @ 2024-06-23 00:00 sftsgly
阅读(149)
评论(0)
推荐(0)
2024年6月22日
GPT-FL GENERATIVE PRE-TRAINED MODELASSISTED FEDERATED LEARNING
摘要: 1、文章贡献 (1)摆脱了对公共数据集的依赖,拥有更多的应用灵活性 (2)合成数据的生成与联邦学习过程是解耦的,从而让合成数据不受客户端的数据分布和模型结构的影响 (3)提供了一种更有效的方式来利用外部数据,能够降低FL的通信和计算成本 (4)下游模型的生成在服务器进行,减少了客户端的计算负担 (5
阅读全文
posted @ 2024-06-22 23:47 sftsgly
阅读(72)
评论(0)
推荐(0)
Federated Learning of Large Language Models with Parameter-Efficient Prompt Tuning and Adaptive Optimization
摘要: 1、文章贡献 (1)提出了一种具有自适应优化的高效参数提示微调方法 FedPepTAO (2)提出了一种评分方法来分析每一层与LLM输出结果的相关性,进而能够得对层进行筛选,从而减少通信成本 (2)在服务端和客户端提供了独创的自适应优化方法来缓解客户端漂移问题 (3)在准确性和效率上比其他的传统方法
阅读全文
posted @ 2024-06-22 23:27 sftsgly
阅读(142)
评论(0)
推荐(0)
Low-Parameter Federated Learning with Large Language Models
摘要: (1)方法分类 【1】前缀微调 在模型输入前构造一段和任务相关的前缀,训练时只更新前缀部分参数,其余参数固定,常用于自然语言生成任务 图一: 前缀微调 【2】P微调(P-Tuning) 和前缀微调类似,但只在嵌入输入层添加token,且插入位置可选,不一定为前缀,常用于自然语言理解任务 图二 :P-
阅读全文
posted @ 2024-06-22 23:10 sftsgly
阅读(118)
评论(0)
推荐(0)
Federated Large Language Model : A Position Paper
摘要: 1、LLM大模型遇到的问题 (1)过度依赖公共数据 目前的LLM模型训练依赖于公共数据,而公共领域的数据存在局限性,无法满足LLM 的训练要求 【1】优质的公共数据集将无法满足日益增长的LLM 模型训练需求 【2】过度依赖于公共数据集可能会导致模型训练结果同质化 (2)隐私数据的困境 私人领域的数据
阅读全文
posted @ 2024-06-22 17:53 sftsgly
阅读(207)
评论(0)
推荐(0)
大语言模型攻击及防御
摘要: 1、主动攻击 主动攻击指故意操纵训练数据或训练模型以实现恶意攻击目标。其攻击方式可能涉及更改模型以防止全局模型收敛;或让特定样本错误分类,从而减少对全局模型整体性能的影响 。 1.1中毒攻击类型 (1)基本概念 数据投毒是指,攻击者将少量精心设计的中毒数据样本添加到模型的训练数据集中,利用训练或者微
阅读全文
posted @ 2024-06-22 17:33 sftsgly
阅读(320)
评论(0)
推荐(0)
2024年5月4日
电商离线数据仓库搭建总结
摘要: 1、数据源 数据库数据不能直接作为数据仓库数据源的原因: (1)数据库要求行式存储,数据仓库要求列式存储,直接对接会导致查询速度过慢,数据仓库性能有影响 (2)数据库中存储的数据不是海量数据,数据仓库要求数据是海量数据,否则分析效果不佳 (3)数据库不是为了数据仓库而服务的,若直接对接数据仓库会导致
阅读全文
posted @ 2024-05-04 19:03 sftsgly
阅读(386)
评论(0)
推荐(0)
2024年1月1日
物流项目(一):采集平台
摘要: 1、数据仓库的作用 (1)采集存储 (2)计算分析 2、数据来源 (1)业务数据 (2)用户行为 (3)爬虫数据 3、流程 (1)DataX 负责全量导入,Flink-CDC 负责增量导入 (2)DWD 存储事实表(用户具体做了什么事),DIM 存储维度表(用于描述事实表) (3)DWS 负责预聚合
阅读全文
posted @ 2024-01-01 14:28 sftsgly
阅读(87)
评论(0)
推荐(0)
2023年10月23日
HBase/Phoenix学习总结
摘要: 1、HBase 定义 以 hdfs 为数据存储的,一种分布式,可扩展的 NoSQL 数据库 2、HBase 数据模型 HBase 数据模型的关键在于稀疏、分布式、多维、排序的映射。其中映射 map 指代非关系型数据库的 k-v 结构。 映射:由行键、列键和时间戳索引,每个值都是一个未解释的字节数组
阅读全文
posted @ 2023-10-23 20:15 sftsgly
阅读(308)
评论(0)
推荐(0)
2023年10月18日
Flink学习总结
摘要: 1、Flink 特点 (1)批流统一 同一套代码,可以跑流也可以跑批 同一个 SQL,可以跑流也可以跑批 (2)性能卓越 高吞吐 低延时 (3)规模计算 支持水平扩展架构 支持超大状态与增量检查点机制 (4)生态兼容 支持与 yarn 集成 支持与 kubernetes 集成 支持单机模式运行 (5
阅读全文
posted @ 2023-10-18 10:37 sftsgly
阅读(173)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
下一页