阅读时间不到 1 分钟

作者: 作者图标Sangam SwadiK

视频

1.2 版本中的即将推出的功能

scikit-learn 的下一个版本 (v1.2) 开始,所有 sklearn 变换器都将提供 pandas dataframe 输出!这将使在 dataframe 上运行管道变得更加容易,并提供更好的方法来跟踪特征名称。以前,将转换后的输出映射回列将很麻烦,因为在复杂预处理的情况下(例如,多项式特征),它可能不是一对一的映射。

变换器的 pandas dataframe 输出功能通过自动跟踪从管道生成的特征来解决此问题。变换器输出格式可以明确配置为 numpypandas 输出格式,如 sklearn.set_config 和下面的示例代码所示。

from sklearn import set_config
set_config(transform_output = "pandas")

请参阅示例笔记本,pandas-dataframe-output-for-sklearn-transformer.ipynb 和文档,以获取更详细的示例和用法。

报告错误

我们很乐意收到您对此的反馈。如果您有任何建议或发现错误,请在 scikit-learn 问题 中报告。

感谢 🙏🏾 维护者: Thomas J. FanGuillaume LemaitreChristian Lorentzen !!