谁在使用 scikit-learn?#
J.P.Morgan#
Spotify#
Inria#
betaworks#
Betaworks 是一家总部位于纽约的初创工作室,致力于开发新产品、发展公司并投资其他公司。在过去的 8 年里,我们推出了一系列由社交数据分析驱动的服务,例如 Bitly、Chartbeat、digg 和 Scale Model。betaworks 数据科学团队始终使用 Scikit-learn 来完成各种任务。从探索性分析到产品开发,它是我们工具包中不可或缺的一部分。最近的使用包括在 digg 的新视频推荐系统 和 Poncho 的 动态启发式子空间聚类 中。
Gilad Lotan,首席数据科学家
Hugging Face#
Evernote#
构建分类器通常是一个迭代过程,包括探索数据、选择特征(被认为在某种程度上具有预测性的数据属性)、训练模型,最后评估它们。对于许多此类任务,我们依赖于出色的 Python scikit-learn 包。
Mark Ayzenshtat,增强智能副总裁
Télécom ParisTech#
Booking.com#
AWeber#
scikit-learn 工具包对于 AWeber 的数据分析和管理团队来说是不可或缺的。它使我们能够完成如果没有时间或资源就无法完成的 AWesome 工作。文档非常出色,允许新工程师快速评估并将许多不同的算法应用于我们的数据。在处理 AWeber 大量电子邮件内容时,文本特征提取实用程序非常有用。RandomizedPCA 实现,以及 Pipelining 和 FeatureUnions,使我们能够高效可靠地开发复杂的机器学习算法。
任何有兴趣了解 AWeber 如何在生产环境中部署 scikit-learn 的人,都应该查看 AWeber 的 Michael Becker 在 PyData Boston 上的演讲,可在 mdbecker/pydata_2013 获得。
Michael Becker,软件工程师,数据分析和管理忍者
Yhat#
Rangespan#
Birchbox#
Bestofmedia Group#
Change.org#
PHIMECA Engineering#
HowAboutWe#
PeerIndex#
DataRobot#
OkCupid#
Lovely#
Data Publica#
Machinalis#
Scikit-learn 是 Machinalis 进行的所有机器学习项目的基石。它具有一致的 API、广泛的算法选择以及大量用于处理样板代码的辅助工具。我们已将其用于各种项目的生产环境中,包括点击率预测、信息提取,甚至数绵羊!
事实上,我们使用得如此之多,以至于我们开始将常见的用例冻结到 Python 包中,其中一些是开源的,例如 FeatureForge。Scikit-learn 用一句话来说:太棒了。
Rafael Carrascosa,首席开发人员
solido#
通过 Solido,Scikit-learn 正在帮助推动摩尔定律。Solido 创建了计算机辅助设计工具,被排名前 20 位的半导体公司和晶圆厂的大多数用于设计智能手机、汽车等内部的尖端芯片。Scikit-learn 帮助为 Solido 的稀有事件估计、最坏情况验证、优化等算法提供动力。在 Solido,我们特别喜欢 scikit-learn 用于高斯过程模型、大规模正则化线性回归和分类的库。Scikit-learn 提高了我们的生产力,因为对于许多机器学习问题,我们不再需要“自己编写”代码。这个 PyData 2014 演讲 提供了详细信息。
Trent McConaghy,Solido Design Automation Inc. 创始人
INFONEA#
Dataiku#
我们的软件 Data Science Studio (DSS) 使用户能够创建结合 ETL 和机器学习的数据服务。我们的机器学习模块集成了许多 scikit-learn 算法。scikit-learn 库与 DSS 完美集成,因为它为几乎所有业务案例提供了算法。我们的目标是提供一个透明且灵活的工具,使构建数据服务、准备数据和在所有类型数据上训练机器学习算法等耗时方面的优化变得更容易。
Florian Douetteau,Dataiku 首席执行官
Otto Group#
在 Otto Group,作为全球五大 B2C 在线零售商之一,我们在日常工作的各个方面都使用 scikit-learn,从数据探索到机器学习应用程序的开发再到这些服务的生产部署。它帮助我们解决从电子商务到物流的各种机器学习问题。它一致的 API 使我们能够围绕它构建 Palladium REST-API 框架,并持续提供基于 scikit-learn 的服务。
Christian Rammig,Otto Group 数据科学主管
Zopa#
MARS#
BNP Paribas Cardif#
BNP Paribas Cardif 在其生产中的几个机器学习模型中使用了 scikit-learn。自 2015 年以来,我们的内部开发人员和数据科学家社区一直在使用 scikit-learn,原因有几个:开发、文档和贡献治理的质量,以及贡献社区的庞大规模。我们甚至在内部模型风险治理中明确提到了 scikit-learn 管道的使用,作为我们降低运营风险和过拟合风险的良好实践之一。作为支持开源软件开发,尤其是 scikit-learn 项目的一种方式,我们决定自 2018 年创建以来参与 La Fondation Inria 的 scikit-learn 联盟。
Sébastien Conort,BNP Paribas Cardif 首席数据科学家