2021 Python 计算生态五月推荐榜

21年5月10日 · Python123 4502 人阅读
![]() |
看见更大的世界,遇见更好的自己
See a better world to meet better for ourselves.
数据科学是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。随着数据科学的不断发展,新的工具很自然的出现,在过去的一年中遇到了一些可以对数据科学之旅非常有用的Python第三方库,以下库可以分为三类:模型部署、数据建模、探索性数据分析。
2021年5月,数据科学方面的优秀资源越来越来多,但这可能有些让人不知所措,不知道从哪里入手,好事者特别推荐10款优秀的Python计算生态,用于了解Python的数据科学。
Streamlit
Streamlit是一个开放源代码的Python库,可轻松创建和共享用于机器学习和数据科学的Web应用程序。Streamlit是建立和共享数据应用程序的最快方法。
![]() |
Gradio
仅使用几行代码,为您的ML模型、函数或 API 生成易于使用的UI界面。直接集成到 Python 笔记本中,或与任何人共享链接。
![]() |
sweetviz
Sweetviz是一个开放源代码Python库,可生成精美的高密度可视化文件,以单行代码启动EDA(探索性数据分析)。输出是一个完全独立的HTML应用程序。
![]() |
https://github.com/fbdesignpro/sweetviz
PyCaret
PyCaret是一个低代码的机器学习库,它使您可以在选择的笔记本环境中从几分钟之内准备好数据到部署模型。
![]() |
prophet
prophet是在R和Python中实现的预测程序。它的速度快,并提供完全自动化的预测,可以由数据科学家和分析师手动调整。
![]() |
https://facebook.github.io/prophet/
pandas-profiling
pandas-profiling只需要一行代码就可以生成数据EDA报告。pandas-profiling基于pandas的DataFrame数据类型,可以简单快速地进行探索性数据分析。
![]() |
https://github.com/pandas-profiling/pandas-profiling
D-Tale
D-Tale是Flask后端和React前端的结合,为我们提供了一种查看和分析Pandas数据结构的简便方法。它与Jupyter笔记本和Python终端无缝集成。
![]() |
https://github.com/man-group/dtale
AutoViz
AutoViz解决了执行数据可视化工作时可能出现的许多挑战。可以通过输入 Pandas DataFrame 或要导入的原始 csv 文件,使用一行代码来调用该工具。
https://github.com/AutoViML/AutoViz
plotly
Plotly是一款用来做数据分析和可视化的在线平台,功能非常强大,可以在线绘制很多图形比如条形图、散点图、饼图、直方图等等。
![]() |
Kedro
Kedro是一个开放源代码Python框架,用于创建可重现,可维护和模块化的数据科学代码。它借鉴了软件工程最佳实践的概念,并将其应用于机器学习代码。应用的概念包括模块化,关注点分离和版本控制。
![]() |
Python3Turtle