參與大數(shù)據(jù)、人工智能相關(guān)的項(xiàng)目的技術(shù)人員,掌握一些數(shù)據(jù)工具對項(xiàng)目建設(shè)至關(guān)重要。本文推薦一些優(yōu)秀的開源數(shù)據(jù)分析與可視化工具,可以在從數(shù)據(jù)清洗到可視化等過程提高工作效率。
1.Apache Superset
https://github.com/apache/superset
Apache Superset是一個開源數(shù)據(jù)挖掘以及數(shù)據(jù)可視化平臺,用戶不需要編程知識就可以創(chuàng)建交互式儀表盤。平臺支持各種數(shù)據(jù)源,提供豐富的可視化組件,并允許自定義儀和共享表盤。
平臺在功能性方面,它集成了各種數(shù)據(jù)庫和數(shù)據(jù)倉庫,并提供了一個強(qiáng)大的SQL編輯器。在安全性方面,平臺可通過基于角色的訪問控制和身份驗(yàn)證。在可擴(kuò)展性方面,它允許添加自定義功能,并且也有一個大型的、活躍的開源社區(qū)。
2.Metabase
https://github.com/metabase/metabase
Metabase是一個開源的商業(yè)智能工具,具有友好的用戶界面、強(qiáng)大的數(shù)據(jù)可視化功能和交互式儀表板。它支持與各種數(shù)據(jù)源集成,支持實(shí)時查詢,并提供自動報告。
Metabase還提供數(shù)據(jù)探索和發(fā)現(xiàn)工具,通過基于角色的訪問控制以確保安全。它可以私有化部署,為項(xiàng)目提供了較為靈活的方案。
3.OpenRefine
https://github.com/OpenRefine/OpenRefine
OpenRefine是一個基于Java的數(shù)據(jù)管理和分析工具。支持用戶使用Web端實(shí)現(xiàn)數(shù)據(jù)加工、可視化和功能擴(kuò)展。
OpenRefine的主要功能包括挖掘、集群、協(xié)調(diào)、無限撤銷/重做、隱私和Wiki。
4.Insights
https://github.com/mariusandra/insights
Insights是一個用于可視化地挖掘PostgreSQL數(shù)據(jù)庫的工具,在圖形的生成具有較強(qiáng)優(yōu)勢。
它支持PostgreSQL連接,自動檢測發(fā)現(xiàn)數(shù)據(jù)庫,允許連接到多個數(shù)據(jù)庫,并允許模式編輯和添加自定義SQL字段。
它還提供數(shù)據(jù)挖掘、過濾器、基于時間的圖形、鍵盤導(dǎo)航、保存的視圖和固定的字段等功能。
安裝如下:
復(fù)制
npm install -g insightsinsights initinsights startbr
5.Retentioneering
https://github.com/retentioneering/retentioneering-tools
Retentioneering是一個Python庫,它主要用于分析點(diǎn)擊流、用戶軌跡和事件日志變等,并產(chǎn)生比漏斗分析,以便更廣泛和更深入理解用戶行為。
使用Retentioneering來探索用戶行為,細(xì)分用戶,并形成關(guān)于是什么驅(qū)使用戶采取期望的行動或遠(yuǎn)離產(chǎn)品的假設(shè)。
Retentioneering使用點(diǎn)擊流數(shù)據(jù)來構(gòu)建行為細(xì)分,突出顯示影響您的轉(zhuǎn)化率,保留和收入的用戶行為中的事件和模式。Retentioneering庫是專門為數(shù)據(jù)分析師、營銷分析師、產(chǎn)品所有者、經(jīng)理以及任何負(fù)責(zé)提高產(chǎn)品質(zhì)量的人創(chuàng)建的。
Retentioneering作為Cyberter環(huán)境的組成部分,它擴(kuò)展了pandas、NetworkX、scikit-learn庫的功能,以更有效地處理順序事件數(shù)據(jù)。Retentioneering優(yōu)化工具是交互式的,專為分析研究而量身定制,因此,非Python專家也可使用它。只需幾行代碼,就可以處理數(shù)據(jù),探索用戶行為地圖,并進(jìn)行可視化。
6.FlyFish
飛魚(FlyFish)是一個數(shù)據(jù)可視化編碼平臺。通過簡易的方式快速創(chuàng)建數(shù)據(jù)模型,通過拖拉拽的形式,快速生成一套數(shù)據(jù)可視化解決方案。
功能包括:
項(xiàng)目管理:項(xiàng)目用于代表具體的業(yè)務(wù)需求場景,是多個應(yīng)用、組件的集合。
應(yīng)用開發(fā):支持開發(fā)大屏應(yīng)用,可開發(fā)單頁面或是多頁面路由的大屏應(yīng)用。
組件開發(fā):組件為最小粒度的項(xiàng)目基礎(chǔ),通過創(chuàng)建和開發(fā)組件拼湊出最終的可視化大屏展示。
模板庫:可將開發(fā)完成的應(yīng)用/組件分別上傳到對應(yīng)的模板庫中,可在已有模板的基礎(chǔ)上快速創(chuàng)建新的項(xiàng)目。
數(shù)據(jù)源管理:可接入 MySQL、Http 等多個數(shù)據(jù)庫數(shù)據(jù)生成對應(yīng)數(shù)據(jù)源,供創(chuàng)建項(xiàng)目時組件對數(shù)據(jù)進(jìn)行調(diào)用。
數(shù)據(jù)查詢:支持根據(jù)數(shù)據(jù)表進(jìn)行 SQL 查詢,精準(zhǔn)定位數(shù)據(jù)源中具體數(shù)據(jù)并封裝保存,也可將查詢到的數(shù)據(jù)重新組合,供組件直接調(diào)用。
7.AKShare
https://github.com/akfamily/akshar
AKShare是一個開源財經(jīng)數(shù)據(jù)Python接口庫,旨在簡化獲取財務(wù)數(shù)據(jù)的過程。它需要Python(64 bit)3.8或更高版本。