指令记录

原理：https://developer.baidu.com/article/details/2798734
用法：https://blog.csdn.net/orangerfun/article/details/131927248
& https://www.cnblogs.com/zhangxuegold/p/17531896.html
本地加载数据集的两个例子：
load_dataset("/defaultShare/archive/zhangyang/cache/huggingface/datasets/wikitext/wikitext-2-raw-v1", split='train') traindata = load_dataset( 'json', data_files={'train': '/defaultShare/archive/zhangyang/cache/huggingface/hub/datasets--allenai--c4/snapshots/1588ec454efa1a09f29cd18ddd04fe05fc8653a2/en/c4-train.00000-of-01024.json.gz'}, split='train' )
load_dataset(cache_dir = "")缓存路径下一定是datasets集合下有数据吗？
以上示例均来自claude

load_datasets()缓存的文件怎么加载？

缓存路径

HF_HOME

git镜像（不一定有效）

git clone https://hub.fastgit.org/

vscode版本查看

https://code.visualstudio.com/updates/v1_85

posted @ 2024-11-25 20:52 张扬zy 阅读(27) 评论(0) 收藏举报

刷新页面返回顶部

指令记录

命令行环境变量设置：

复制：

解压：

ubuntu版本查看：

vim多行删除：

xz命令？：（误区之一开始以为要下载xz，然后还想要下载yum，而且还卡住了，但是实际上没有必要 https://computingforgeeks.com/how-to-extract-xz-files-on-linux/）

文件查看：

scp命令：

conda:

huggingface数据下载：

加载（load_dataset）：

load_datasets()缓存的文件怎么加载？

缓存路径

git镜像（不一定有效）

vscode版本查看

公告