图书标签: 机器学习 Python 机器学习数据挖掘 计算科学 计算机科学 数据分析 馆藏 CS
发表于2024-12-23
Python大战机器学习 pdf epub mobi txt 电子书 下载 2024
数据科学家是当下炙手可热的职业,机器学习则是他们的必备技能。机器学习在大数据分析中居于核心地位,在互联网、金融保险、制造业、零售业、医疗等产业领域发挥了越来越大的作用且日益受到关注。
Python 是最好最热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的首选语言。
《Python大战机器学习:数据科学家的第一个小目标》以快速上手、四分理论六分实践为出发点,讲述机器学习的算法和Python 编程实践,采用“原理笔记精华+ 算法Python 实现+ 问题实例+ 代码实战+ 运行调参”的形式展开,理论与实践结合,算法原理与编程实战并重。
《Python大战机器学习:数据科学家的第一个小目标》从内容上分为13 章分4 篇展开:第一篇:机器学习基础篇(第1~6 章),讲述机器学习的基础算法,包括线性模型、决策树、贝叶斯分类、k 近邻法、数据降维、聚类和EM算法;第二篇:机器学习高级篇(第7~10 章),讲述经典而常用的高级机器学习算法,包括支持向量机、人工神经网络、半监督学习和集成学习;第三篇:机器学习工程篇(第11~12章),讲述机器学习工程中的实际技术,包括数据预处理,模型评估、选择与验证等;第四篇:Kaggle 实战篇(第13 章),讲述一个Kaggle 竞赛题目的实战。
《Python大战机器学习:数据科学家的第一个小目标》内容丰富、深入浅出,算法与代码双管齐下,无论你是新手还是有经验的读者,都能快速学到你想要的知识。本书可供为高等院校计算机、金融、信息、自动化及相关理工科专业的本科生或研究生使用,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。
华校专,计算机专业硕士。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C++ STL 的风格实现了各种算法(算法导论的C++实现已经放在个人的github上),目前已从部队退役,并顺利拿到了阿里的算法工程师offer。
只是他个人笔记,推导跳跃很快,可能大牛和他自己看得懂。
评分请不要看任何自诩为“(清华)学霸”的书,前面算法部分写得一塌糊涂,就是把公式生搬硬套,没有解释步骤过程的原因,如果只是这种程度我很怀疑作者是否真的理解。本书最后部分的kaggle实战也很水,前面是数据清理merge和dropna,预处理做了one-hot和归一化,之后的模型就只是调了sklearn的GradientBoostingClassifier,我就想说要不要脸,你搞机器学习你就用GBDT调用调参来忽悠人,模型都不是自己建的,还不如各位去看sklearn的官方文档。你好歹来个神经网络什么的啊,最起码的keras都不提,是作者不会还是不想教?要学这些建议大家自学keras或tensorflow的官方文档,算法书籍的话看PRML或网上博客。我其实想打零星的。
评分请不要看任何自诩为“(清华)学霸”的书,前面算法部分写得一塌糊涂,就是把公式生搬硬套,没有解释步骤过程的原因,如果只是这种程度我很怀疑作者是否真的理解。本书最后部分的kaggle实战也很水,前面是数据清理merge和dropna,预处理做了one-hot和归一化,之后的模型就只是调了sklearn的GradientBoostingClassifier,我就想说要不要脸,你搞机器学习你就用GBDT调用调参来忽悠人,模型都不是自己建的,还不如各位去看sklearn的官方文档。你好歹来个神经网络什么的啊,最起码的keras都不提,是作者不会还是不想教?要学这些建议大家自学keras或tensorflow的官方文档,算法书籍的话看PRML或网上博客。我其实想打零星的。
评分代码错误连篇,理论一知半解。注:代码错误指的不是版本更迭之后方法调用的问题,是他真的就错了。
评分本来看着目录还可以,以为有干货,但是发现书中一半的篇幅都是在介绍如何用sklearn调包,和参数介绍,而没有具体实现,另外算法的原理讲解也比较简短,感觉对于只想学会用工具的还是可以一看,机器学习方向的还是不建议阅读
看线性回归部分的推导就让人云里雾里,不知道为什么明明几个式子的问题能搞成那样。 实践部分就是调包,没啥实际的用处,用的时候可以查一下,不过还不如官方文档。 吐槽下,这书根本不是告诉别人如何如何(作者确定是在教别人么……),就是作者的笔记罢了,只适合他自己...
评分主要内容就是翻译文档,比较水 p3 一定要先做feature scaling p205 svm的复杂度。早停策略,将数据集分成训练集和验证集两类。当验证误差升高但训练误差降低时,停止训练。同时返回具有最小验证集误差的连接权值和阈值。 p246 boosting和adaboost算法很有用 主要内容就是翻译文...
评分看线性回归部分的推导就让人云里雾里,不知道为什么明明几个式子的问题能搞成那样。 实践部分就是调包,没啥实际的用处,用的时候可以查一下,不过还不如官方文档。 吐槽下,这书根本不是告诉别人如何如何(作者确定是在教别人么……),就是作者的笔记罢了,只适合他自己...
评分主要内容就是翻译文档,比较水 p3 一定要先做feature scaling p205 svm的复杂度。早停策略,将数据集分成训练集和验证集两类。当验证误差升高但训练误差降低时,停止训练。同时返回具有最小验证集误差的连接权值和阈值。 p246 boosting和adaboost算法很有用 主要内容就是翻译文...
评分看线性回归部分的推导就让人云里雾里,不知道为什么明明几个式子的问题能搞成那样。 实践部分就是调包,没啥实际的用处,用的时候可以查一下,不过还不如官方文档。 吐槽下,这书根本不是告诉别人如何如何(作者确定是在教别人么……),就是作者的笔记罢了,只适合他自己...
Python大战机器学习 pdf epub mobi txt 电子书 下载 2024