您的位置:首页 > 教育 > 锐评 > Linux文件编码格式为unknown 8bit

Linux文件编码格式为unknown 8bit

2024/10/31 9:51:08 来源:https://blog.csdn.net/weixin_40860432/article/details/139527644  浏览:    关键词:Linux文件编码格式为unknown 8bit
file -i 1.txt

显示文件编码为unknown 8bit, 说明这个文件的编码格式因为一些不明原因无法识别了。
可以尝试用其他编辑器打开,来看一下编辑器最终是用什么编码格式打开的。

  • vim
:set filecoding
  • notepad++
    直接打开文件,右下角会显示文件编码

假设文件编码为GBK/GB2312(GBK兼容GB2312编码方式并且涵盖字符更广),以GBK为例,让这个文件找回自己的编码方式。

iconv -f GBK -t GBK input.txt -o output.txt

然后再运行

file -i output.txt

文件编码恢复。

总结:确认/推测文件源编码为GBK,现检测文件编码unknown 8bit,想要转换文件编码为UTF-8。则必须先from GBK to GBK,让文件找回正确的编码格式,再from GBK to UTF-8。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com