爱丽丝·郑(Alice Zheng)
亚马逊广告平台建模和优化团队负责人,应用机器学习、生成算法和平台开发领域的技术领导者,前微软研究院机器学习研究员。
阿曼达·卡萨丽(Amanda Casari)
谷歌云开发者关系工程经理,曾是Concur Labs的产品经理和数据科学家,在数据科学、机器学习、复杂系统和机器人等多个领域都有丰富经验。
特征工程是机器学习流程中至关重要的一个环节,然而专门讨论这个话题的著作却寥寥无几。本书旨在填补这一空白,着重阐明特征工程的基本原则,介绍大量特征工程技术,教你从原始数据中提取出正确的特征并将其转换为适合机器学习模型的格式,从而轻松构建模型,增强机器学习算法的效果。
然而,本书并非单纯地讲述特征工程的基本原则,而是通过大量示例和练习将重点放在了实际应用上。每一章都集中研究一个数据问题:如何表示文本数据或图像数据,如何为自动生成的特征降低维度,何时以及如何对特征进行标准化,等等。最后一章通过一个完整的例子演示了多种特征工程技术的实际应用。书中所有代码示例均是用Python编写的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。
- 数值型数据的特征工程:过滤、分箱、缩放、对数变换和指数变换
- 自然文本技术:词袋、n元词与短语检测
- 基于频率的过滤和特征缩放
- 分类变量编码技术:特征散列化与分箱计数
- 使用主成分分析的基于模型的特征工程
- 模型堆叠与k-均值特征化
- 图像特征提取:人工提取与深度学习
[https://github.com/apachecn/feature-engineering-for-ml-zh] ==========================================================================================================================================================
评分在图书馆看到的,感觉内容很棒,来豆瓣mark一下,上班有钱后买一本。吐个槽,书有点薄,59元略贵。虽然知识无价,不过对比国内出版物环境,嗯....相对有点点问题。 声明一下,这本书不是入门书籍,不适合机器学习入门/python入门的来看。 虽然英文名叫Feature Engineering for ...
评分特征工程是数据科学工程的核心,目前关于这个话题专门的书籍不多。本书通过概念(不是理论)和案例代码相结合的方式,还该了特征工程中的一些基础技术。包括分类型变量编码,数值型数据的分箱,变换。文本处理,PCA以及基于模型的特征工程。模型堆叠和k-均值特征化。最后简单介...
评分[https://github.com/apachecn/feature-engineering-for-ml-zh] ==========================================================================================================================================================
评分在图书馆看到的,感觉内容很棒,来豆瓣mark一下,上班有钱后买一本。吐个槽,书有点薄,59元略贵。虽然知识无价,不过对比国内出版物环境,嗯....相对有点点问题。 声明一下,这本书不是入门书籍,不适合机器学习入门/python入门的来看。 虽然英文名叫Feature Engineering for ...
作为一个高数只学过数理统计的人,这本书看得太特么难受了,全是乱七八糟的名词,同一个概念,上下句间还要换种叫法,可以说很装逼了。给的代码集跟书上写的代码不是一路的,目前还没看出是干嘛用的。第二章欧式范数缩放的图非常有误导性且跟公式不搭配,当我们都已经会了吗?mix-max缩放的公式减号还丢了,差评。
评分feature engineering for ml翻译成精通特征工程,真要从内容上看,翻成特征工程入门差不多,没多少新东西,也没多少实用的调参经验,看完还是像以前一样,一个个方法试错。另,像是写完没审直接出版了。
评分卧槽,才发现自己好久没看专业书籍了……
评分概括性的介绍了特征工程的一些方法,不够深入,而且专有名词很多,代码不错
评分还行
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有