首页计算机书籍计算机语言《数据科学导论:Python语言实现》阿尔贝托·博斯凯蒂 卢卡·马萨罗著 于俊伟 靳小波译
白诺

文档

207

关注

0

好评

0
PDF

《数据科学导论:Python语言实现》阿尔贝托·博斯凯蒂 卢卡·马萨罗著 于俊伟 靳小波译

阅读 660 下载 0 大小 14.08M 总页数 71 页 2022-11-23 分享
价格:¥ 10.00
下载文档
/ 71
全屏查看
《数据科学导论:Python语言实现》阿尔贝托·博斯凯蒂 卢卡·马萨罗著 于俊伟 靳小波译
还有 71 页未读 ,您可以 继续阅读 或 下载文档
1、本文档共计 71 页,下载后文档不带www.pdfdz.com水印,支持完整阅读内容。
2、古籍基本都为PDF扫描版,所以文档不支持编辑功能,即不支持文档内文字的复制粘贴。
3、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
4、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
5、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
本章只是一个简短的介绍,我们将从一些基础知识开始,逐步展开并介绍以下主题:·如何创建Python数据料学工县箱·IPython的用法·本书要使用的数据集的概述数据科学是相对较新的知识领域,尽管它的核心内容已经被计算机科学界研究了很多年。它的研究内容包括线性代数、统计建模、可视化、计算语言学、图形分析、机器学习、商务智能、数据存储与检索。作为一个新的领域,读者必须考虑到目前数据科学的界定还不是很清晰,并且在不断地变化。由于该领域由多种学科构成,数据科学家各自的专业领域和能力不同,因此对这一领域的描述也不尽相同。在这种情况下,作为职业数据科学家,什么才会是你高效地学习和使用的行业工具呢?我们相信Pytho会是最好的工具,本书将向你提供快速使用Pytho的所有重要信息。另外,其他的工具如R和MATLAB是数据科学家解决统计分析和矩阵操作等具体问题的专用工具。然而,只有Pythor完整包含了数据科学家所需要的技能。这种多功能语言适合开发与演示,不管你是什么背景和专业,都很容易学习和堂握。Pythor于1991年创健,是一种通用的、解释性和面向对象的语言,已经逐渐征服了科学界,成长为一个成熟的数据处理和分析的专业软件。它能够使你进行无数次的快速体验,轻松地进行理论扩展,并促进多种形式的科学应用。目前,Python已成为数据科学不可或缺的工具,它的主要特性女如下:·ython可方便地集成不同的工具,为多种语言ava、C、Fortran-甚至原语)、数据策略和学习算法提供真正的统一平台。这些学习算法结合在一起,能帮助数据科学家制订新的、功能强大的解决方案。·Py山为数据分析和机器学习提供了一个大型、成熟的软件系统。确保提供数据分析课程需要的一切工具,甚至会更多。·yt山on是通用的。不管你是什么编程背景和风格(面向对象或者过程式的),都会喜欢使用Python编程。·ython.是跨平台的。yhon解决方案完美兼容Windows、.Linux和Mac OSa操作系统,不用担心它的可移植性。·虽然Pythor是解释性语言,但与其他主流数据分析语言如R和MATLAB:相比具有导庸置疑的遮度优势(尽管还不能与C、Java和新出现的ulia语言的诡度相媳美)。得益于本书将要介绍的一些简单技巧,它还能变得更快。·由于Pytho县有极小的内存占用和优秀的内存管理能力,它可以处理内存中的大数据。当进行数据加我、转换、切块、切片、保存或丢弃时,它会使用循环或再循环垃圾回收器自动清理内存中的数据。·ytho如非常简单,易学易用。掌握了基础知识之后就可以立即开始编程,没有比这更好的学习方式了。1.2 Python的安装首先,我们继续介绍Pyho所需要的环境设置,以便创建一个完整的数据科学工作环境,确保能对本书后面提供的示例代码和实验进行测试。Python是一种开源的、面向对象的、跨平台的编程语言,与其直接竞争对手(比如C++和ava)相比非常简明,能在非常短的时间内创建工作软件原型。它仅仅是因为这个特点就成为数据科学家工具箱中最常用语言的吗?当然不是。它还是一种通用语言,能为一系列问题和需求提供格种各样的软件包,的确非常灵活。1.3科学计算发行版正如前面已经介绍过的,创建工作环境对于数据科学家来说是相当费时的操作。首先,你需要安装却ytho,然后逐个安装需要的库(有时候,安装过程可能不会像你想象的那么利)。如果你想节省时间和精力,同时确保有一个完整的Pytho工环境,那么你只需要下载、安装并运行Pytho科学计算发行版就可以了。除了Pythor,科学计算发行版还包括各种预安装的工具包,有时候甚至会提供附加工具和DE(集成开发环境)。其中有些工具包是数据科学家所熟知的,在后面的章节中我们会介绍这些工具包的关键特性。建议你立即下载、安装一个科学计算发行版,如Anaconda版(这是工具包最齐全的版本)。将本书的示例练习完后,可以完全卸载发行版,再单独安装Pytho,只附带少数几个需要的工具包就可以了。1.4 IPython简介IPytho是交互式任务的专用工具,它的特殊命令能够帮助开发人员更好地理解正在编写的代码。这些命令是:·:?和:??:输出的详细描述(使用“??”能得到更详细的帮助信息)。·%:这是魔术函数的特殊调用格式。让我们通过示例演示这些命令的用法。首先使用“ipython”命令启动交互式控制台,运行IPython,如下所示: