Python库是功能的集合,它使我们能够执行许多动作而无需每次都编写大量代码。 Python是一种开放源代码的高级编程语言,它随库或软件包一起提供用于不同目的,例如数据清理,数据整理等。
在开始使用Python for Data Science之前,应该了解10个Python库。




Numpy是Python中用于执行科学计算的基本库。 它还为我们提供了各种数学和数据处理功能。
Numpy提供以下功能:
· N维数组对象,用于存储数据
·数学函数
·集成C / C ++和Fortran代码的工具
·它提供有用的线性代数,傅立叶变换和随机数函数/方法。


Pandas是Python的开源数据分析库。 它有助于以2D表格结构存储数据,即以行和列的形式存储数据,其中行代表样本,列代表各种特征或属性。 熊猫具有用于数据清理和数据整理目的的特殊功能和方法。


Matplotlib是Python中的二维绘图库。 该库主要用于可视化数据以便更好地理解。 它是用于绘制图形的最常用的Python库之一,它允许进行高级别的自定义。
您可以使用matplotlib的不同方法(只需几行代码)来生成图,直方图,功率谱,条形图,误差图,散点图等。


Seaborn是基于matplotlib库的数据可视化库。 它为我们提供了用于创建引人入胜且内容丰富的统计图形的高级界面。


Scikit-learn是Python的机器学习库。 该库基于Numpy,Scipy和Matplotlib。 它为不同的机器学习算法提供了不同的方法,有助于执行数据处理和预测分析。


Requests是用于发出HTTP请求的Python库。 它用于请求HTML页面提供其内容,并将该内容用于数据分析。


Bokeh是一个交互式数据可视化库,其功能类似于matplotlib和seaborn,但是它具有更高级的功能,可以更高级的方式可视化数据。 它允许将悬停,缩放,单击和其他功能添加到我们的绘图中。 这些功能有助于我们以更易理解的方式深入并了解特定数据或绘图的特定区域。


SQLAlchemy是一个Python数据库工具包和一个对象关系映射器(ORM),它提供了SQL的强大功能和灵活性。 它允许使用不同的数据库执行CRUD操作,而无需编写大量的SQL代码。


BeautifulSoup是一个Python库,用于从HTML和XML文件中提取数据。 它有助于从HTML和XML抓取数据,并以已解析树的形式存储已解析的页面。 它主要用于Web抓取。


iPython是用于以不同语言进行计算的交互式外壳。 iPython为我们提供以下功能:
•互动壳
•它提供了一个基于Web的交互式笔记本界面,以支持编写代码,数学表达式,创建绘图等。
•它支持交互式数据可视化和GUI工具包的使用。
•提供用于并行计算的工具。