您的位置:首页 > 教育 > 锐评 > 四川省住建厅考试报名官网_开发app外包公司_宁波 seo整体优化_哪个杭州seo好

四川省住建厅考试报名官网_开发app外包公司_宁波 seo整体优化_哪个杭州seo好

2025/2/23 9:18:53 来源:https://blog.csdn.net/qq_55880505/article/details/143268178  浏览:    关键词:四川省住建厅考试报名官网_开发app外包公司_宁波 seo整体优化_哪个杭州seo好
四川省住建厅考试报名官网_开发app外包公司_宁波 seo整体优化_哪个杭州seo好

【问题描述】datasets.exceptions.DatasetGenerationError: An error occurred while generating the dataset

使用load_dataset读取在HuggingFace上的数据集,代码如下

from transformers import pipeline
from transformers import Trainer, TrainingArgumentsimport os
os.environ["http_proxy"] = "http://127.0.0.1:7890"
os.environ["https_proxy"] = "http://127.0.0.1:7890"from datasets import load_datasetraw_datasets = load_dataset("glue", "mrpc")
raw_datasets

pip install datasets直接装了库,然后一运行就报错了

【问题解决】
本文原先的datasets是2.13.1
将其降低版本为2.1.0就好了

# 尝试降级到一个更稳定的版本
pip install datasets==2.1.0

【其他解决办法】

  1. 清理缓存:删除 Hugging Face 缓存文件夹中与 glue 相关的数据,以确保加载的是最新的数据集文件。默认的缓存路径是 ~/.cache/huggingface/datasets,你可以删除该文件夹下 glue 相关的内容,然后重新运行代码。
from datasets import load_dataset
import shutil
import os# 删除特定数据集的缓存
cache_dir = os.path.expanduser("~/.cache/huggingface/datasets")
glue_cache_path = os.path.join(cache_dir, "glue")
if os.path.exists(glue_cache_path):shutil.rmtree(glue_cache_path)# 重新加载数据集
raw_datasets = load_dataset("glue", "mrpc")
print(raw_datasets)

2.升级datasets

pip install --upgrade datasets
# 或者如果升级不奏效,尝试降级到一个更稳定的版本
pip install datasets==2.1.0

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com