初級 Data Visualization
記錄一下以前數據可視化工具的初級使用方式。
主要是用 gnuplot 將 .csv 中的數據,整合成圖形輸出。
( 安裝直接參考: gnuplot 上的説明。)
擧個實際的例子來看這個問題。用中國主要城市的空氣污染指數 (AQI) 來做數據。 比較幾個典型城市的 AQI。
數據來源
從 github 倉庫 AQI 下到的 .csv 。大致格式如下:
- 這個 csv 的列是: 行號,城市代號,城市名,污染指數,污染類型,時間
- 挑選 北、南、中三個城市: 上海 (310000); 北京 (110000); 广州(440100)。
生成各個城市的數據
簡單的用 grep
來生成 3 個,城市的 .csv ,比如: (aqi.csv 就是之前下載到的 AQI 數據)
用 gnuplot 生成對比
- X 軸為日期,格式 ‘%Y-%m-%d’。日期範圍為 2010-02-01 至 2015-02-01。
- Y 軸為污染指數。
- plot command 用 csv 的第 6 列和第 4 列,做 3 個城市的 .csv 數據輸出。
輸出結果
大概輸出結果如下:
紅線是北京,綠綫是廣州,藍綫是上海。看來是越南方空氣越好些。
最後
初級入門用法,還有不同的作圖命令,可以參考 gnuplot 的手冊和自帶的 samples
(安裝目錄 gnuplot/demo
下)
blog comments powered by Disqus