Python中使用不同编码读写txt文件详解

脚本专栏 2025/1/26 佚名

3 1 2

复制代码代码如下:
import os
import codecs
filenames=os.listdir(os.getcwd())

out=file("name.txt","w")
for filename in filenames:
out.write(filename.decode("gb2312").encode("utf-8"))
out.close()

将执行文件的当前目录及文件名写入到name.txt文件中，以utf-8格式保存
如果采用ANSI编码保存，用如下代码写入即可：
复制代码代码如下:
out.write(filename)

打开文件并写入

引用codecs模块，对该模块目前不了解。在此记录下方法，有空掌握该模块功能及用法。
复制代码代码如下:
import codecs
file=codecs.open("lol.txt","w","utf-8")
file.write(u"我")
file.close()

读取ANSI编码的文本文件和utf-8编码的文件

读取ANSI编码文件

建立一个文件test.txt，文件格式用ANSI，内容为:
复制代码代码如下:
abc中文

用python来读取
复制代码代码如下:
# coding=gbk
print open("Test.txt").read()

结果：abc中文
读取utf-8编码文件（无BOM）
把文件格式改成UTF-8：
复制代码代码如下:
结果：abc涓枃

显然，这里需要解码：
复制代码代码如下:
# -*- coding: utf-8 -*-
import codecs
print open("Test.txt").read().decode("utf-8")

结果：abc中文

读取utf-8编码文件（有BOM）

某些软件在保存一个以UTF-8编码的文件时，默认会在文件开始的地方插入三个不可见的字符（0xEF 0xBB 0xBF，即BOM）。在有些软件可以控制是否插入BOM。如果在有BOM的情况下，在读取时需要自己去掉这些字符，python中的codecs module定义了这个常量：
复制代码代码如下:
# -*- coding: utf-8 -*-
import codecs
data = open("Test.txt").read()
if data[:3] == codecs.BOM_UTF8:
data = data[3:]
print data.decode("utf-8")

结果：abc中文
在看下面的例子：
复制代码代码如下:
# -*- coding: utf-8 -*-
data = open("name_utf8.txt").read()
u=data.decode("utf-8")
print u[1:]

打开utf-8格式的文件并读取utf-8字符串后，解码变成unicode对象。但是会把附加的三个字符同样进行转换，变成一个unicode字符。该字符不能被打印。所以为了正常显示，采用u[1:]的方式，过滤到第一个字符。
注意：在处理unicode中文字符串的时候，必须首先对它调用encode函数，转换成其它编码输出。

设置python默认编码

复制代码代码如下:
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
print sys.getdefaultencoding()

今天碰到了 python 编码问题, 报错信息如下
复制代码代码如下:
Traceback (most recent call last):
File "ntpath.pyc", line 108, in join
UnicodeDecodeError: 'ascii' codec can't decode byte 0xa1 in position 36: ordinal not in range(128)

显然是当前的编码为ascii, 无法解析0xa1(十进制为161, 超过上限128). 进入python console后, 发现默认编码确实是 ascii, 验证过程为:
在python2.6中无法调用sys.setdefaultencoding()函数来修改默认编码，因为python在启动的时候会调用site.py文件，在这个文件中设置完默认编码后会删除sys的setdefaultencoding方法。不能再被调用了. 在确定sys已经导入的情况下, 可以reload sys这个模块之后, 再 sys.setdefaultencoding('utf8')

复制代码代码如下:
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
print sys.getdefaultencoding()

确实有效, 根据 limodou 讲解, site.py 是 python 解释器启动后, 默认加载的一个脚本. 如果使用 python -S 启动的话, 将不会自动加载 site.py.

上面写的挺啰嗦的.

==================================
如何永久地将默认编码设置为utf-8呢"codetitle">复制代码代码如下:
import sys
sys.setdefaultencoding('utf-8')

既然 sitecustomize.py 能被自动加载, 所以除了设置编码外, 也可以设置一些其他的东西
字符串的编码
复制代码代码如下:
s1='中文'

像上面那样直接输入的字符串是按照代码文件的编码来处理的，如果是unicode编码，有以下三种方式：
复制代码代码如下:
1 s1 = u'中文'
2 s2 = unicode('中文','gbk')
3 s3 = s1.decode('gbk')

unicode是一个内置函数，第二个参数指示源字符串的编码格式。
decode是任何字符串具有的方法，将字符串转换成unicode格式，参数指示源字符串的编码格式。
encode也是任何字符串具有的方法，将字符串转换成参数指定的格式。

Python,编码,读写,txt,文件

华山资源网 Design By www.eoogi.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

上一篇
 Python中super关键字用法实例分析

下一篇
 Python使用Supervisor来管理进程的方法

华山资源网 Design By www.eoogi.com

评论“Python中使用不同编码读写txt文件详解”

再想想

暂无评论...

www.eoogi.com 华山资源网

120,135影音资源

344,641技术资源

22,817软件资源

435,032站长资源

最新文章

群星《奔赴！万人现场第2期》[FLAC/分轨][5

2025/1/26
43

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2025/1/26
32

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2025/1/26
61

【古典音乐】詹姆斯·高威《季节》1993[WAV+

2025/1/26
24

贝拉芳蒂《卡里普索之王》SACD[WAV+CUE]

2025/1/26
74

站点导航
抖音极速版河马剧场京东小红书微信高德地图红果短剧夸克美团剪映拼多多支付宝淘宝快手 QQ 哔哩哔哩番茄小说得物阿里巴巴王者荣耀和平精英腾讯视频爱奇艺 QQ音乐咸鱼之王逆水寒三国志战略版梦幻西游金铲铲之战捕鱼大作战原神英雄联盟手游网易云音乐崩坏星穹铁道优酷视屏酷狗音乐蛋仔派对

《魔兽世界》大逃杀！60人新游玩模式《强袭风暴》3月21日上线
暴雪近日发布了《魔兽世界》10.2.6 更新内容，新游玩模式《强袭风暴》即将于3月21 日在亚服上线，届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。
艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕，并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时，他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中，玩家将会进入一个全新的海盗主题大逃杀式限时活动，其中包含极高的风险和史诗级的奖励。
《强袭风暴》不是普通的战场，作为一个独立于主游戏之外的活动，玩家可以用大逃杀的风格来体验《魔兽世界》，不分职业、不分装备（除了你在赛局中捡到的），光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式，玩家在加入海盗主题的预赛大厅区域前，可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹，《巨龙崛起》和《魔兽世界：巫妖王之怒经典版》的玩家都可以获得奖励。

更新日志

2025年01月26日

群星《奔赴！万人现场第2期》[FLAC/分轨][518.87MB]

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》[320K/MP3][43.91MB]

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》[FLAC/分轨][140.49MB]

【古典音乐】詹姆斯·高威《季节》1993[WAV+CUE]

贝拉芳蒂《卡里普索之王》SACD[WAV+CUE]

2025年01月26日

小骆驼-《草原狼2(蓝光CD)》[原抓WAV+CUE]

群星《欢迎来到我身边电影原声专辑》[320K/MP3][105.02MB]

群星《欢迎来到我身边电影原声专辑》[FLAC/分轨][480.9MB]

雷婷《梦里蓝天HQⅡ》 2023头版限量编号低速原抓[WAV+CUE][463M]

群星《2024好听新歌42》AI调整音效【WAV分轨】

王思雨-《思念陪着鸿雁飞》WAV

王思雨《喜马拉雅HQ》头版限量编号[WAV+CUE]

李健《无时无刻》[WAV+CUE][590M]

陈奕迅《酝酿》[WAV分轨][502M]

卓依婷《化蝶》2CD[WAV+CUE][1.1G]

群星《吉他王(黑胶CD)》[WAV+CUE]

齐秦《穿乐(穿越)》[WAV+CUE]

发烧珍品《数位CD音响测试-动向效果（九）》【WAV+CUE】

邝美云《邝美云精装歌集》[DSF][1.6G]

吕方《爱一回伤一回》[WAV+CUE][454M]

友情链接

杰晶网络 DDR爱好者之家桃源资源网杰网资源富贵资源网南强小屋铁雪资源网幽灵资源网万梅资源网狼山资源网白云岛资源网昆仑资源网相思资源网明霞山资源网内蒙古资源网黑松山资源网茶园资源网饿虎岗资源网大旗谷资源网常春岛资源网岱庙资源网兴国资源网快活林资源网蝙蝠岛资源网帝王谷资源网白云城资源网伏龙阁资源网清风细雨楼天枫庄资源网圆月山庄资源网无争山庄资源网神水资源网移花宫资源网神剑山庄资源网无为清净楼资源网金钱帮资源网丐帮资源网华山资源网极乐门资源网小李飞刀资源网凤求凰客栈风云阁资源网金狮镖局鸳鸯亭资源网千金楼资源网更多链接

华山资源网 Design By www.eoogi.com

Copyright © 2006~2023 华山资源网 Design by www.eoogi.com 手机版