作者:科研貓 | 小獵豹
責編:科研貓 | 依米
今天教大家來畫一種非常知性優雅(一眼萬年那種的~)的圖形:小提琴圖。
小提琴圖
定義:Violin plot,和Boxplot一樣,也是一種用作顯示一組資料分散情況資料的統計圖,其形狀類似小提琴。它主要用于反映原始資料分布的特征,還可以進行多組資料分布特征的比較。
解讀:小提琴圖是【箱線圖】與【核密度圖】的結合,箱線圖展示了分位數的位置,核密度圖則展示了任意位置的密度,通過小提琴圖可以知道哪些位置的資料點聚集的較多,因其形似小提琴而得名。如下圖所示,其外圍的曲線寬度代表資料點分布的密度,中間的箱線圖則和普通箱線圖表征的意義是一樣的,代表着中位數、上下分位數、極差等。
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLicmbw5iNzQDNzQTNyIDNlZzMlBDZ0AjZ1UmNzQmYxMGM3UDOx8CX0JXZ252bj91Ztl2Lc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
繪制方法:使用ggplot2包的geom_violin()函數繪制小提琴圖,為了更好地表征資料分布,再用geom_boxplot()函數疊加一個箱線圖。
繪圖操作:使用科研貓提供的提琴圖·R代碼,隻要提供幾個參數即可:
(1)設定用來繪圖的資料檔案;
(2)設定小提琴的顔色,可以是red、blue、green等各種顔色,當你想繪制多種顔色時,使用“random”;
(3)設定x軸的标簽;
(4)設定y軸的标簽
然後直接運作代碼即可。
隻需短短幾秒,你就會徹底愛上我們的代碼,我們的小提琴圖。超高顔值、時尚穿搭,editor都說愛了呢。
網站概覽
介紹完小提琴圖,給大家隆重介紹一下全網首個開源繪圖平台-Hiplot。Hiplot是openbiox聯合科研貓鄭重推出的,免費注冊,無需安裝,一站式繪圖的開源繪圖平台,你還在等什麼?導言
資料可視化在科研工作中發揮着越來越重要的作用。基于可視化圖形,我們可以更好地展示科研資料中的主要特征和規律。以生物醫學為例,大多數臨床醫學學生和初級科研工作者一般需要花費數十天乃至數月的時間去熟悉和掌握常用的資料可視化工具,如 SPSS、Origin 和 Graphpad。之後才有可能去完成部分基礎的資料統計分析和可視化。如果是要專門從事資料分析和模組化方向的相關人員則還需額外學習一門甚至數門程式設計語言(如 MATLAB、R 和 Python )。而要達到能夠自由探索資料的水準則還需要額外花費更多時間去深入學習和進階。
近年來,随着各類雲計算平台(如生物醫學領域的 Galaxy 和 DNAnexus)、相關 IT 軟硬體基礎設施的發展(如分布式計算、容器技術、軟體包管理器、資料分析流程建構架構等),初級科研工作者已經可以相對比較輕松地擷取相關資料的上遊分析結果。特别是當正常組學資料的上遊分析流程趨于穩定和完善,資料上遊分析流程的可自定義程度和可變程度已經大大降低。而資料分析下遊流程中的可視化和個性化深度解讀已經成為目前使用者面臨的最大挑戰:
- 開源使用者社群開發的可視化軟體或方法大多還沒有很好的整合在一個統一的使用者接口之下;
- 國内缺少活躍的針對科研資料可視化的協作社群,“** 畫圖群”成為初級科研使用者為數不多的選擇;
- 國内缺少類似于 Graphpad、MATLAB 核心資料可視化軟體和平台,在被美國禁用之後,隻能花費額外成本進行流程遷移或重頭開始開發;
- 相關資料可視化工具仍然相對匮乏,雜志和使用者需求旺盛,已釋出多年的 Circos 圓圈圖可視化,通過封裝一些便捷操作就可以發表文章:
- Rasche H, Hiltemann S. Galactic Circos: User-friendly Circos plots within the Galaxy platform. Gigascience. 2020;9(6):giaa065. doi:10.1093/gigascience/giaa065;
- Marx H, Coon JJ. MS-Helios: a Circos wrapper to visualize multi-omic datasets. BMC Bioinformatics. 2019;20(1):21. Published 2019 Jan 11. doi:10.1186/s12859-018-2564-9; Yu Y, Ouyang Y, Yao W.
- shinyCircos: an R/Shiny application for interactive creation of Circos plot. Bioinformatics. 2018;34(7):1229-1231. doi:10.1093/bioinformatics/btx763)
國内外開發的一些平台和工具使用者體驗一般:使用者界面不夠美觀;中英文支援的屈指可數;上手仍然有一定難度;部分平台的檔案管理不太友善;使用者能夠主動參與平台建設的少之又少。
Hiplot簡介
Hiplot 是由 openbiox 社群于 2019 年 10 月發起,并在新冠疫情爆發後快速發展的一個社群開發項目:緻力于建立一個快速疊代、支援中英文環境的科研資料可視化平台和協作社群。目前該平台建設已初具規模,已提供基于 R 語言的 40 餘種基礎可視化的功能。
Hiplot 項目發起的初衷就是為了解決廣大臨床醫學學生和科研工作者的基礎科研方面的可視化需求:
- 基礎可視化:覆寫大多數基礎的科研可視化功能,參照 SPSS、GraphPad、國内外開發的相關可視化軟體和工具
- 進階可視化:包括 Shiny 在内的複雜可視化圖形和應用;文獻圖表的重制和再分析;新的可視化圖形展示插件:如基于 Circos、circlize 的二次開發;openbiox 社群貢獻的可視化應用(如 UCSCXenaShiny 和 bioshiny)
- 其他任務:低計算量的其他任務(如文獻資料資源下載下傳、RESTful APIs 通路等)
- 檔案管理(支援上傳、下載下傳、複制、移動、删除、線上預覽和編輯等操作)
Hiplot使用者
互動界面展示(部分)
登入
注冊
基礎繪圖卡片浏覽與檢索
繪圖示例 | 相關性熱圖
繪圖示例 | 免疫浸潤分析
檔案上傳視窗
檔案浏覽與管理
檔案線上檢視和編輯
(支援文本檔案、XLSX、CSV、TXT 等)
檔案線上檢視和編輯
(支援文本檔案、XLSX、CSV、TXT 等)
送出文獻原文和附錄下載下傳任務
(基于 openbiox 社群貢獻的 bget 項目)
送出文獻原文和附錄下載下傳任務
(基于 openbiox 社群貢獻的 bget 項目)
本期幹貨
- 小提琴圖繪制代碼 -
領取方法
關注“科研貓”公衆号
公衆号首頁點選“更多資訊”-“聯系客服”領取幹貨
更多科研新鮮資訊、文獻精讀和生物資訊技能
請關注科研貓公衆号
科研貓原創出品,任何形式轉載,均需獲授權
若您是讀者,歡迎分享,無需授權
易法通律師事務所提供版權法律支援