谁在使用 scikit-learn?#
摩根大通#
Spotify#
法国国家信息与自动化研究所 (INRIA)#
betaworks#
Betaworks 是一家位于纽约的初创公司工作室,致力于开发新产品、发展公司并投资其他公司。在过去的 8 年中,我们推出了许多基于社交数据分析的服务,例如 Bitly、Chartbeat、digg 和 Scale Model。betaworks 数据科学团队始终使用 Scikit-learn 来完成各种任务。从探索性分析到产品开发,它是我们工具包中不可或缺的一部分。最近的应用包括 digg 的新视频推荐系统 和 Poncho 的 动态启发式子空间聚类。
Gilad Lotan,首席数据科学家
Hugging Face#
Evernote#
构建分类器通常是一个迭代过程,包括探索数据、选择特征(被认为以某种方式具有预测性的数据属性)、训练模型,最后评估模型。对于许多这些任务,我们依赖于 Python 中出色的 scikit-learn 包。
Mark Ayzenshtat,增强智能副总裁
巴黎综合理工大学#
Booking.com#
AWeber#
scikit-learn 工具包对于 AWeber 的数据分析和管理团队来说是必不可少的。它使我们能够完成一些我们没有时间或资源完成的“AWesome”事情。文档非常出色,使新工程师能够快速评估并将许多不同的算法应用于我们的数据。文本特征提取实用程序在处理 AWeber 中的大量电子邮件内容时非常有用。RandomizedPCA 实现以及 Pipelining 和 FeatureUnions 使我们能够高效可靠地开发复杂的机器学习算法。
任何有兴趣了解 AWeber 如何在生产环境中部署 scikit-learn 的人,都应该查看 AWeber 的 Michael Becker 在 PyData Boston 上的演讲,这些演讲可在 mdbecker/pydata_2013 中找到。
Michael Becker,软件工程师,数据分析和管理忍者
Yhat#
Rangespan#
Birchbox#
Bestofmedia Group#
Change.org#
PHIMECA Engineering#
HowAboutWe#
PeerIndex#
DataRobot#
OkCupid#
Lovely#
Data Publica#
Machinalis#
scikit-learn 是 Machinalis 所有机器学习项目的基石。它拥有一个一致的 API、各种算法选择以及许多辅助工具来处理样板代码。我们在各种项目中将其用于生产环境,包括点击率预测、信息提取,甚至数羊!
事实上,我们使用它太多了,以至于我们开始将常见的用例冻结到 Python 包中,其中一些是开源的,例如 FeatureForge。scikit-learn 简而言之:太棒了。
Rafael Carrascosa,首席开发人员
solido#
scikit-learn 正在通过 Solido 推动摩尔定律。Solido 创建了计算机辅助设计工具,这些工具被大多数排名前 20 的半导体公司和晶圆厂使用,用于设计智能手机、汽车等内部的尖端芯片。scikit-learn 有助于为 Solido 的稀有事件估计、最坏情况验证、优化等算法提供动力。在 Solido,我们特别喜欢 scikit-learn 的高斯过程模型、大规模正则化线性回归和分类库。scikit-learn 提高了我们的生产力,因为对于许多 ML 问题,我们不再需要“自己编写”代码。 此 PyData 2014 演讲 有详细介绍。
Trent McConaghy,Solido Design Automation Inc. 创始人
INFONEA#
Dataiku#
我们的软件 Data Science Studio (DSS) 使用户能够创建将 ETL 与机器学习相结合的数据服务。我们的机器学习模块集成了许多 scikit-learn 算法。scikit-learn 库与 DSS 完美集成,因为它提供了适用于几乎所有业务案例的算法。我们的目标是提供一个透明且灵活的工具,使优化构建数据服务、准备数据和对所有类型数据训练机器学习算法的耗时方面变得更加容易。
Florian Douetteau,Dataiku 首席执行官
Otto Group#
在奥托集团,全球五大 B2C 在线零售商之一,我们从数据探索到机器学习应用程序的开发,再到这些服务的生产部署,在日常工作的所有方面都使用 scikit-learn。它帮助我们解决从电子商务到物流的各种机器学习问题。它一致的 API 使我们能够围绕它构建 Palladium REST-API 框架 并持续交付基于 scikit-learn 的服务。
Christian Rammig,奥托集团数据科学主管