![]() | 此條目可参照英語維基百科相應條目来扩充。 (2022年8月27日) |
机器学习与数据挖掘 |
---|
![]() |
特徵工程(英語:feature engineering)又稱特徵提取(英語:feature extraction)或特徵發現(英語:feature discovery)是使用領域知識從原始數據中提取特徵(特徵、屬性、特性)的過程。 是机器学习和概率模型中的一个预处理步骤[1]。该步骤的主要功能,是将原始数据转换为更有效的输入集。與僅向機器學習過程提供原始數據相比,其動機是使用這些額外的功能來提高機器學習的准确性和决策能力。[2][3][4]
除了机器学习之外,特征工程的原理还被应用于包括物理学在内的各种科学领域。例如,物理学家构建无量纲量,如流体动力学中的雷诺数、传热中的努塞尔数以及沉降领域中的阿基米德数。该思想也被用于初步近似,例如力学中材料强度的解析解。[5]
参考文献
- ^ Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome H. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer. 2009. ISBN 978-0-387-84884-6 (英语).
- ^ Sharma, Shubham; Nayak, Richi; Bhaskar, Ashish. Multi-view feature engineering for day-to-day joint clustering of multiple traffic datasets. Transportation Research Part C: Emerging Technologies. 2024-05-01, 162: 104607. Bibcode:2024TRPC..16204607S. ISSN 0968-090X. doi:10.1016/j.trc.2024.104607
.
- ^ Shalev-Shwartz, Shai; Ben-David, Shai. Understanding Machine Learning: From Theory to Algorithms. Cambridge: Cambridge University Press. 2014. ISBN 9781107057135.
- ^ Murphy, Kevin P. Probabilistic Machine Learning. Cambridge, Massachusetts: The MIT Press (Copyright 2022 Massachusetts Institute of Technology, this work is subject to a Creative Commons CC-BY-NC-ND license). 2022. ISBN 9780262046824.
- ^ MacQueron C. SOLID-LIQUID MIXING IN STIRRED TANKS : Modeling, Validation, Design Optimization and Suspension Quality Prediction (报告). 2021. doi:10.13140/RG.2.2.11074.84164/1.