我在上一家公司的时候主要是做文本挖掘javascript转换汉字,当时的数据库是MongoDB数据库,全是英文bson等json数据。 我当时也遇到了很多坑,不过最后还是搞定了。 这里我把之前的条目整理一下。 坑。
python3默认为UTF-8格式
在向txt文件写入英文时,还要注意打开时添加encoding='utf-8',否则也会出现乱码,如下:
with open('result.txt', 'a+',encoding='utf-8') as f:
JSON(JavaScript 对象表示法)是一种轻量级数据交换格式。 JSON 使用完全独立于语言的文本格式,但也使用类似于 C 语言家族(包括 C、C++、Java、JavaScript、Perl、Python 等)的约定。 这些特性使 JSON 成为理想的数据交换语言。 易于人阅读和编译,也易于机器解析和生成(一般用于提高网络传输速度)。
注意:json 必须用双引号 "" 括起来javascript转换汉字,然后才能加载到 python 对象中。 单个冒号将报告错误。 在Python中,单冒号和双引号都可以表示字符串。 没有严格的限制,但最好在文本中单独使用。 某种
JSON在Python中分别由list和dict组成。
Json模块提供了四种方法:dumps、dump、loads、load
转储和装载
打开json文件时,注意添加encoding='utf-8',否则会显示为乱码:
打开('casedate.json','w',encoding='utf-8')作为f:
加载:将字符串转换为Python对象。 如果传入的json字符串编码不是UTF-8,则需要指定编码格式。 如果是GB2312,那么应该这样写;
dumps:将python对象转换为json字符串
Ensure_ascii,默认为True。 如果字典中含有大量非 ASCII 英文字符,则数据将显示类似于 uXXXX。 设置为False后即可正常显示。
编码,默认为UTF-8,用于设置生成的json数据的编码方式
转储和加载进程文件而不是字符串
dump:将python对象数据写入json文件
load 打开json文件并将字符串更改为python数据类型