file -i 1.txt
显示文件编码为unknown 8bit, 说明这个文件的编码格式因为一些不明原因无法识别了。
可以尝试用其他编辑器打开,来看一下编辑器最终是用什么编码格式打开的。
- vim
:set filecoding
- notepad++
直接打开文件,右下角会显示文件编码
假设文件编码为GBK/GB2312(GBK兼容GB2312编码方式并且涵盖字符更广),以GBK为例,让这个文件找回自己的编码方式。
iconv -f GBK -t GBK input.txt -o output.txt
然后再运行
file -i output.txt
文件编码恢复。
总结:确认/推测文件源编码为GBK,现检测文件编码unknown 8bit,想要转换文件编码为UTF-8。则必须先from GBK to GBK,让文件找回正确的编码格式,再from GBK to UTF-8。