sklearn 变换器 Pandas DataFrame 输出
视频
1.2 版本中的即将推出的功能
从 scikit-learn 的下一个版本 (v1.2) 开始,所有 sklearn 变换器都将提供 pandas dataframe 输出!这将使在 dataframe 上运行管道变得更加容易,并提供更好的方法来跟踪特征名称。以前,将转换后的输出映射回列将很麻烦,因为在复杂预处理的情况下(例如,多项式特征),它可能不是一对一的映射。
变换器的 pandas dataframe 输出功能通过自动跟踪从管道生成的特征来解决此问题。变换器输出格式可以明确配置为 numpy 或 pandas 输出格式,如 sklearn.set_config 和下面的示例代码所示。
from sklearn import set_config
set_config(transform_output = "pandas")
请参阅示例笔记本,pandas-dataframe-output-for-sklearn-transformer.ipynb 和文档,以获取更详细的示例和用法。
文档和示例笔记本的链接
报告错误
我们很乐意收到您对此的反馈。如果您有任何建议或发现错误,请在 scikit-learn 问题 中报告。
感谢 🙏🏾 维护者: Thomas J. Fan,Guillaume Lemaitre,Christian Lorentzen !!