阅读时长 3 分钟

Lucy Liu 于 2020 年 9 月加入 scikit-learn 团队。在本访谈中,了解 Lucy 从 rstats 到 scikit-learn 的开源之旅。

  1. 请您介绍一下自己。

    我叫 Lucy,在新西兰长大,文化上是中国人。我现在住在澳大利亚,为 Quansight 实验室工作。

  2. 您最初是如何参与开源的?

    我是在开始攻读研究型硕士学位时第一次接触到开源的,当时我发现我的临床验光师工作没有成就感。我喜欢学习编程,但最初我不敢贡献,因为我只是个初学者。硕士毕业后,我在担任生物信息学家期间,编写了一些 R 包用于分析利基生物医学数据,并将它们发布在 github 上。我第一次为现有的开源项目做出贡献是在后来,当时我在 INRIA(法国国家信息与自动化研究所)与 INRIA scikit-learn 核心开发人员一起工作。他们帮助我提交了第一个拉取请求,从那时起我就一直在贡献!

  3. 您是如何参与 scikit-learn 的?您能分享一些您印象深刻的 scikit-learn 拉取请求吗?

    我对统计学和代码非常感兴趣,所以我非常渴望为 scikit-learn 做贡献。由于我在这两个领域都是相对的初学者,所以我从贡献文档开始,然后是错误修复和功能。我提交给 scikit-learn 的第一个 PR 是在 2019 年 10 月,用于改进 多类分类文档。我对 scikit-learn 中的校准模块贡献最多(包括重构 CalibratedClassifierCV),这非常有趣,而且在我后来在澳大利亚气象局从事天气预报后处理工作时非常有用。

    参考: Lucy 的拉取请求列表

  4. 您为哪些 OSS 项目和社区做出贡献?

    我为 Sphinx-Gallery 和 scikit-learn 做贡献。Sphinx-Gallery 对我来说是一个很好的开源入门,因为它是一个小型的软件包,不会收到大量的 issue 和 pull request(不像 scikit-learn!)。

  5. 您发现 OSS 有什么吸引力?

    我认为能够查看源代码并回馈项目是最好的部分。如果您对某个功能感兴趣,您可以自己建议并添加它,同时在整个过程中从代码审查中学习!

  6. 您在社区主导的 OSS 中观察到哪些痛点?

    我认为 OSS 社区的某些积极方面也会导致痛苦。虽然能够从来自不同背景的人那里获得许多不同的观点很好,但这也会使达成共识变得更加困难,从而减缓进度。来自任何地理位置的人都可以异步地一起工作,但这可能也意味着人们在自己的孤岛中工作,这使得项目难以形成一致的方向。大型项目也具有很高的学习曲线,这使得新贡献者和有兴趣成为核心开发人员的贡献者难以参与。后者是如果项目缺乏核心开发人员时间来维护项目和审查 PR 的问题。

  7. 如果我们讨论 OS 在 10 年内的发展,您希望看到什么?

    某种能够实现资金持续性的系统,该系统可以将来自公共和私人来源的资金结合起来。这将使 OS 项目能够进行长期规划,并为开发人员提供更多工作稳定性。在同一领域(例如,科学 Python)的项目之间进行更好的协调将为使用 Python 进行项目的用户提供更好的体验。

  8. 您最喜欢的资源、书籍、课程、会议等是什么?

    Real Python 有很棒的教程,而 regex101 使正则表达式变得更容易编写和审查!

    我还很喜欢 YouTube 频道 statquest,它以非常易懂的方式解释了统计概念,并以一首小曲来介绍视频——还能要求什么呢?

  9. 除了工作和开源之外,您的爱好是什么?

    我喜欢骑自行车,并且强烈支持为人们而不是汽车设计城市。我还喜欢攀岩(室内和室外),虽然最近没有太多时间进行这项活动。