python小专题——JSON

小编 2026-06-25 阅读:1230 评论:0
python对json的相关操作  说实话,不做前端开发,对json真没有太特殊的感情,最近遇到...

python对json的相关操作

  说实话,不做前端开发,对json真没有太特殊的感情,最近遇到python操作json,束手无策,也准备简单了解下相关知识。以前刚听到json的时候,总把它误以为一种语言,不料,它却是一种数据结构。我按了tab键发现json的方法很少,只有6个,并且两两互逆。查看json的使用方法,除了官方的文档(http://docs.python.org/2/library/json.html),还可以一个命令解决:>>> help(json),看了这个说明之后,然后下面所有的都是废话了。不过介于这样看不太方便,我还是准备"copy"一份到这里,呵呵~~~

  首先JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,或者可理解为一种通讯方式,能被WEB所识别和公认的数据类型,是“名称/值”对的集合(A collection of name/value pairs。在不同的语言,它有不同的表现方式,如:对象(object),纪录(record),结构(struct),字典(dictionary),哈希表(hash table),有键列表(keyed list),或者关联数组 (associative array)。值的有序列表(An ordered list of values)。

  dumps方法和loads方法

简单来理解就是:dumps方法——将python类型的数据编码成json类型

        loads方法——将json类型的数据解码成python类型

  首先学习一下对简单数据类型的encoding,使用json.dumps方法对简单数据类型进行编码:

>>> import json>>> pyobj=[[1,2,3],123,123.123,'abc',{'key1':(1,2,3),'key2':(4,5,6)}]>>> encodedjson = json.dumps(pyobj)>>> print repr(pyobj)[[1, 2, 3], 123, 123.123, 'abc', {'key2': (4, 5, 6), 'key1': (1, 2, 3)}]>>> print encodedjson[[1, 2, 3], 123, 123.123, "abc", {"key2": [4, 5, 6], "key1": [1, 2, 3]}]

  仔细对比下两个print的结果还是有区别的(有些数据类型发生了变化),在json的编码过程中,会存在从python原始类型向json类型的转化过程,具体的转化对照如下:

python小专题——JSON

      上述看出,json.dumps()方法返回了一个str对象encodedjson,接下来在对encodedjson进行decode,得到原始数据类型,需要使用的json.loads()函数:

>>> decodejson=json.loads(encodedjson)>>> print type(decodejson)  #查看解码后的数据类型<type 'list'>>>> print decodejson[4]['key1'][1, 2, 3]>>> print decodejson[[1, 2, 3], 123, 123.123, u'abc', {u'key2': [4, 5, 6], u'key1': [1, 2, 3]}]

loads方法原始的对象,但发生了一些数据类型的转化。比如,上例中‘abc’转化为了unicode类型。从json到python的类型转化对照如下:

python小专题——JSON

  json.dumps方法提供了很多好用的参数可供选择,比较常用的有sort_keys(对dict对象进行排序,我们知道默认dict是无序存放的),separators,indent等参数。

排序功能使得存储的数据更加有利于观察,也使得对json输出的对象进行比较,例如:

python小专题——JSON

  上例中,本来data1和data2数据应该是一样的,但是由于dict存储的无序特性,造成两者无法比较。因此两者可以通过排序后的结果进行存储就避免了数据比较不一致的情况发生,但是排序后再进行存储,系统必定要多做一些事情,也一定会因此造成一定的性能消耗,所以适当排序是很重要的。

indent参数是缩进的意思,它可以使得数据存储的格式变得更加优雅。

python小专题——JSON

 

  输出的数据被格式化之后,变得可读性更强,但是却是通过增加一些冗余的空白格来进行填充的。json主要是作为一种数据通信的格式存在的,而网络通信是很在乎数据的大小的,无用的空格会占据很多通信带宽,所以适当时候也要对数据进行压缩。separator参数可以起到这样的作用,该参数传递是一个元组,包含分割对象的字符串。

 

python小专题——JSON

 

  通过移除多余的空白符,达到了压缩数据的目的,而且效果还是比较明显的。

另一个比较有用的dumps参数是skipkeys,默认为False。 dumps方法存储dict对象时,key必须是str类型,如果出现了其他类型的话,那么会产生TypeError异常,如果开启该参数,设为True的话,则会比较优雅的过度。

>>> data = {'b':789,'c':456,(1,2):123}>>> print json.dumps(data,skipkeys=True){"c": 456, "b": 789}

    当然还有一些其他参数,完整的参数是:

json.dumps(objskipkeys=Falseensure_ascii=Truecheck_circular=True,allow_nan=True

cls=Noneindent=Noneseparators=Noneencoding="utf-8",default=None

sort_keys=False**kw)

上述都是默认的值,当然可以对它进行改变,ensure_ascii默认是true,所有的非ASCII码都会以uXXXX的序列显示出来。

  

作者:zhoujie
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,不然我担心博客园找你算账
如果您觉得本文对你有帮助,请竖起您的大拇指右下角点推荐,也可以关注我
版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

热门文章
  • 机房智能化温湿度解决方式之POE供电以太网温湿度传感器

    机房智能化温湿度解决方式之POE供电以太网温湿度传感器
    机房智能化温湿度解决方式之POE供电以太网温湿度传感器 北京盈创力和电子科技有限公司 智能型TCP网口温湿度记录仪 北京IP网络温湿度记录仪厂家,北京盈创力和 北京智能型TCP网口温湿度记录仪IP网络温湿度记录仪是一种新型的基于TCP/IP协议双绞线以太网标准温湿度采集模块,利用它可以实现现场温度值、相对湿度值的采集,同时利用其自身的RJ45通信接口可以方便地和机房监控主机或交换机集线器进行联网。 工作于-40℃~85℃工业级带...
  • Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering

    Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering
    Problem Statement 我们考虑一个具有马尔可夫性质、非线性、非高斯的状态空间模型(State Space Model):对于一个时间序列上的观测结果{yt,t∈N}\\{ y_t , t \\in N \\}{yt​,t∈N},我们认为每个观测结果yty_tyt​的生成依赖于一个无法直接观察的隐变量xt∈{xt,t∈N}x_t \\in \\{x_t , t \\in N \\}xt​∈{xt​,t∈N},即:p(...
  • HTTP状态保持的原理

    HTTP状态保持的原理
    a)在用户登录之后,浏览器返回响应的时候会在响应中添加上cookieb)浏览器接收到cookie之后会自动保存c)当用户再次请求同一服务器中的其他网页的时候,浏览器会自动带上之前保存的cookied)服务接收到请求之后可以请 request 对象中取到cookie 判断当前用户是否登录  Http是无状态的,就是连接时数据互通,关闭后...
  • Hive 系统函数及示例

    Hive 系统函数及示例
    查看所有系统函数 show functions; 函数分类 内置函数【系统函数】 数学函数: floor、round、ceil、cos、log2等 字符串函数: length、reverse、trim、lower、get_json_object、repeat等 收集函数: size 转换函数: cast 日期函数: year、month、datediff、date、date_add等 条件函数: coalesce、case…w...
  • CSRF的原理和防范措施

    CSRF的原理和防范措施
    a)攻击原理:i.用户C访问正常网站A时进行登录,浏览器保存A的cookieii.用户C再访问攻击网站B,网站B上有某个隐藏的链接或者图片标签会自动请求网站A的URL地址,例如表单提交,传指定的参数iii.而攻击网站B在访问网站A的时候,浏览器会自动带上网站A的cookieiv.所以网站A在接收到请求之后可判断当前用户是登录状态,所以...
标签列表