跳转至

使用 Shell 脚本来处理 JSON

使用 Shell 脚本来处理 JSON,有以下三种方法:

  • 使用 awk sed
  • 使用第三方库
  • 调用其他脚本解释器

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。 易于人阅读和编写。同时也易于机器解析和生成。 它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999 的一个子集。 JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等)。 这些特性使JSON成为理想的数据交换语言。

来源:http://json.org/json-zh.html

http://ip.taobao.com/service/getIpInfo.php?ip=myip 接口为例,返回的 JSON 数据格式为:

{
    "code": 0,
    "data": {
        "country": "中国",
        "country_id": "CN",
        "area": "华南",
        "area_id": "800000",
        "region": "广东省",
        "region_id": "440000",
        "city": "深圳市",
        "city_id": "440300",
        "county": "",
        "county_id": "-1",
        "isp": "电信",
        "isp_id": "100017",
        "ip": "113.104.182.107"
    }
}

使用内置命令处理

使用内置的 awk sed 来获取指定的 JSON 键值。

function get_json_value()
{
  local json=$1
  local key=$2

  if [[ -z "$3" ]]; then
    local num=1
  else
    local num=$3
  fi

  local value=$(echo "${json}" | awk -F"[,:}]" '{for(i=1;i<=NF;i++){if($i~/'${key}'\042/){print $(i+1)}}}' | tr -d '"' | sed -n ${num}p)

  echo ${value}
}

使用下面的方式可以获得 ip 的值:

get_json_value $(curl -s http://ip.taobao.com/service/getIpInfo.php?ip=myip) ip

使用内置命令的优点是无需额外的依赖,缺点是有些 JSON 格式无法正常获取,需要根据实际情况修改相关的正则或命令参数。

例如,以上脚本获取 data 字段时就会有问题:

get_json_value $(curl -s http://ip.taobao.com/service/getIpInfo.php?ip=myip) data

会返回以下结果:

{country

另外脚本并没有转码功能,所以获取中文值时输出的仍然是原编码,例如获取 isp 字段:

get_json_value $(curl -s http://ip.taobao.com/service/getIpInfo.php?ip=myip) isp

会返回以下结果:

\u7535\u4fe1

使用第三方库处理

jq is like sed for JSON data - you can use it to slice and filter and map and transform structured data with the same ease that sed, awk, grep and friends let you play with text.

来源:https://stedolan.github.io/jq/

jqsed 类似,但是对于处理 JSON 更加友好、方便。由于是第三方库,所以需要单独安装或添加二进制文件到 PATH 路径下。不过 jq 本身是可以跨平台并且单文件即可运行,也很方便。

通过下面的命令可以获得返回的 JSON 数据:

curl -s http://ip.taobao.com/service/getIpInfo.php?ip=myip | jq '.'

如果需要单独获得 ip 的值,只需要修改 jq 的参数即可:

curl -s http://ip.taobao.com/service/getIpInfo.php?ip=myip | jq '.data.ip'

更多用法可以查看 jq 的手册 https://stedolan.github.io/jq/manual/

调用其他脚本解释器

虽然 bash/sh 没有专门处理 JSON 的功能,但是其他脚本解释器通常都是有的,比如 Python、PHP 或者 Ruby,甚至 JavaScript 也可以。

注:PHP 需要有 PHP CLI,JavaScript 需要有 Node。

以 Python 为例获取 ip 的值:

  • Python 2
export PYTHONIOENCODING=utf8
curl -s 'http://ip.taobao.com/service/getIpInfo.php?ip=myip' | \
    python -c "import sys, json; print json.load(sys.stdin)['data']['ip']"
  • Python 3
curl -s 'http://ip.taobao.com/service/getIpInfo.php?ip=myip' | \
    python3 -c "import sys, json; print(json.load(sys.stdin)['data']['ip'])"