新聞資訊  快訊  焦點  財經  政策  社會
互 聯 網   電商  金融  數據  計算  技巧
生活百科  科技  職場  健康  法律  汽車
手機百科  知識  軟件  修理  測評  微信
軟件技術  應用  系統  圖像  視頻  經驗
硬件技術  知識  技術  測評  選購  維修
網絡技術  硬件  軟件  設置  安全  技術
程序開發  語言  移動  數據  開源  百科
安全防護  資訊  黑客  木馬  病毒  移動
站長技術  搜索  SEO  推廣  媒體  移動
財經百科  股票  知識  理財  財務  金融
教育考試  育兒  小學  高考  考研  留學
您當前的位置:首頁 > IT百科 > 程序開發 > 語言 > Python

Python數據可視化的四種簡易方法

時間:2019-09-12 13:08:22  來源:  作者:

數據可視化是任何數據科學或機器學習項目的一個重要組成部分。人們常常會從探索數據分析(EDA)開始,來深入了解數據,并且創建可視化確實有助于讓問題更清晰和更容易理解,尤其是對于那些較大的高維度數據集。在項目結束的時候,能夠以清晰的、簡潔的和令人信服的方式呈現最終結果,這是非常重要的,讓你的用戶能夠理解和明白。你可能已經看過了我之前的文章《5種快速和簡單的Python數據可視化方法(含代碼)》(5 Quick and Easy Data Visualizations in Python with Code),其中介紹了5種基本可視化方法:散點圖、線圖、柱狀圖、條形圖和箱形圖。這五個是簡單而強大的可視化方法,你絕對可以通過這些方法從數據集中得到巨大的收獲。在本文中,將介紹另外4個數據可視化方法,但稍微復雜一些,你可以在看完上一篇文章介紹的基本方法之后再用。

Python數據可視化的四種簡易方法

 

熱圖(Heat Map)

熱圖是數據的矩陣表示方式,其中每個矩陣的值用一種顏色來表示。不同的顏色代表不同的級別,矩陣指數將兩個對比的列或特征連接在一起。熱圖可以很好地顯示出多個特征變量之間的關系,因為可以直接把一個級別看作一種顏色。還可以通過觀察熱圖中的一些點來查看每個關系是如何與數據集中的其它關系進行比較的。這些顏色的確提供了簡單的表示方式,因為這是非常直觀的。

Python數據可視化的四種簡易方法

 

現在來看下代碼:與matplotlib庫相比,seaborn庫可用于更高級的圖表,通常也需要更多的組件,如更多的顏色、圖形或者變量。Matplotlib庫用于顯示圖表,numpy用于生成數據,而pandas用于控制。繪圖只是調用一個簡單的seaborn函數,如果你發現了一些在視覺上很特別的東西,通過這個函數,還可以設置顏色映射。

Python數據可視化的四種簡易方法

 

二維密度圖(2D Density Plot)

二維密度圖是一維版本的簡單擴展,能夠看到關于2個變量的概率分布。讓我們看看下面的二維密度圖,右邊的刻度用顏色表示每一點的概率。最高的概率,看下數據集,似乎大約是0.5的大小和1.4-ish的速度。正如你所看到的,二維密度圖對于快速確定數據對于兩個變量最集中的區域非常地顯著,而不是像一維密度圖那樣只集中一個變量。當你有兩個對輸出結果非常重要的變量,并且希望了解它們如何一起對輸出結果分布起作用的時候,二維密度圖尤其適合。

Python數據可視化的四種簡易方法

 

Seaborn的代碼超級簡單,我們將通過創建一個偏態分布介紹它。如果你發現某些顏色和陰影在視覺上更特別,那么大多數的可選參數都是為了看起來更清晰。

蜘蛛圖(Spider Plot)

蜘蛛圖是顯示一對多關系最好的方法之一。也就是說,你可以繪制并查看區別于單個變量或類別的多個變量的值。在蜘蛛圖中,一個變量相對于另一個變量的特性是顯而易見的,因為面積和長度在一些方向上變化了。如果你希望了解幾個類別關于這些變量是如何疊加起來的,可以并排繪制一下。在下圖中,很容易比較三個電影角色的不同屬性,并了解他們的優勢所在!

Python數據可視化的四種簡易方法

 

這次我們將能夠直接使用matplotlib來創建可視化,而不是用seaborn。需要計算每個屬性所在的角度,因為我們希望它們沿圓周被平均地分隔開。我們將在每個計算的角度放置標簽,然后把值繪制成一個點,該點到中心的距離取決于它的值或是級別。最后,為了清晰起見,我們將使用半透明的顏色填充由連接各屬性點的線所包含的區域。

Python數據可視化的四種簡易方法

 

樹形圖(Tree Diagram)

我們從小學就開始使用樹形圖了,樹形圖既自然又直觀,還易于解釋。直接連接的節點關系密切,而與有多個連接的節點差別很大。在下圖中,我已經根據統計繪制了一小部分來自Kaggle的Pokemon with stats數據集:

HP、攻擊、防御、特殊攻擊、特殊防御、速度

因此,與stats wise最匹配的Pokemon將緊密連接在一起。例如,我們看到,在頂部,Arbok和Fearow是直接連接的,而且,如果我們查看數據,Arbok總共有438個,而Fearow有442個,非常接近。但是一旦我們移動到Raticate,我們得到的總數是413,這與Arbok和Fearow的差別很大,這就是它們被分開的原因。當我們移動樹的時候,基于相似性,Pokemon被分的組越來越多。在綠色組中的Pokemon相互之間比紅色組中的更相似,即使沒有直接的綠色連接。

Python數據可視化的四種簡易方法

 

對于樹形圖,我們實際上要使用Scipy的。在查看了數據集之后,我們將去掉字符串類型的列。我們這么做只是為了要得到正確的可視化結果,但在實踐中,最好是把這些字符串轉換成分類變量,為了得到更好的結果和進行比較,我們還設置了數據幀索引,以便能夠適當地用它作為引用每個節點的列。最后,在Scipy中計算和繪制樹形圖是非常簡單的事了。

Python數據可視化的四種簡易方法

 



Tags:數據可視化   點擊:()  評論:()
聲明:本站部分內容來自互聯網,內容觀點僅代表作者本人,如有任何版權侵犯請與我們聯系,我們將立即刪除。
▌相關評論
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
▌相關推薦
大數據時代商業智能(BI)和數據可視化訴求更為強烈,淘寶大屏更是風靡全球!數據可視化是大數據『最后一公里』,BI喚醒沉睡的數據。...【詳細內容】
2019-09-26   數據可視化  點擊:(19)  評論:(0)  加入收藏
數據可視化是任何數據科學或機器學習項目的一個重要組成部分。人們常常會從探索數據分析(EDA)開始,來深入了解數據,并且創建可視化確實有助于讓問題更清晰和更容易理解,尤其是...【詳細內容】
2019-09-12   數據可視化  點擊:(16)  評論:(0)  加入收藏
在電影《摩天營救》中,監控中心的全方位展示屏幕給人印象深刻?,F在這種立體化大屏幕似乎成了好萊塢大片的標配。其實,這種逼格很高的鏡頭就是一個數據可視化大屏。 隨著社會...【詳細內容】
2019-09-12   數據可視化  點擊:(14)  評論:(0)  加入收藏
最近很多朋友跟我抱怨:為了公司數據好看,老板一個勁地想要數據可視化,以為可視化就是畫畫圖表這么簡單,可苦了自己天天加班做數據,但其實老板根本不懂可視化!確實,數據可視化無疑是...【詳細內容】
2019-09-06   數據可視化  點擊:(23)  評論:(0)  加入收藏
以前我們看到一個做得很爛的圖表,或者穿幫的數據可視化作品時,往往是將它們嘲笑一番也就算了。但有些時候,我們好像更難分辨一個可視化作品是單純的糟糕產物,還是出于偏見而刻意...【詳細內容】
2019-09-03   數據可視化  點擊:(13)  評論:(0)  加入收藏
爬取拉勾網關于python職位相關的數據信息,并將爬取的數據已csv各式存入文件,然后對csv文件相關字段的數據進行清洗,并對數據可視化展示,包括柱狀圖展示、直方圖展示、詞云展示等...【詳細內容】
2019-08-21   數據可視化  點擊:(39)  評論:(0)  加入收藏
推薦資訊
相關文章
欄目更新
欄目熱門
幸运飞艇精准5码二期计划