谁正在使用scikit-learn?#
摩根大通#
Spotify#
Inria#
betaworks#
Betaworks是一家位于纽约的创业工作室,致力于开发新产品、发展公司并投资其他公司。在过去的8年里,我们推出了一些由社交数据分析驱动的服务,例如Bitly、Chartbeat、digg和Scale Model。Betaworks的数据科学团队一直将Scikit-learn用于各种任务。从探索性分析到产品开发,它是我们工具包中不可或缺的一部分。近期应用包括digg的新视频推荐系统,以及Poncho的动态启发式子空间聚类。
Gilad Lotan,首席数据科学家
Hugging Face#
Evernote#
构建分类器通常是一个迭代过程,包括数据探索、特征选择(被认为具有某种预测能力的数据属性)、模型训练以及最终评估。对于许多此类任务,我们依赖于Python中出色的scikit-learn软件包。
Mark Ayzenshtat,增强智能副总裁
巴黎高等电信学院#
Booking.com#
AWeber#
scikit-learn工具包对于AWeber的数据分析与管理团队来说是不可或缺的。它使我们能够完成原本没有时间或资源完成的卓越工作。其文档非常出色,让新工程师能够快速评估并将多种不同算法应用于我们的数据。文本特征提取实用工具在处理AWeber大量电子邮件内容时非常有用。RandomizedPCA实现,以及Pipelining和FeatureUnions,使我们能够高效可靠地开发复杂的机器学习算法。
任何有兴趣了解AWeber如何在生产环境中部署scikit-learn的人,都应该查看AWeber的Michael Becker在PyData Boston上的演讲,可在mdbecker/pydata_2013获取。
Michael Becker,数据分析与管理忍者团队软件工程师
Yhat#
Rangespan#
Birchbox#
Bestofmedia Group#
Change.org#
PHIMECA工程#
HowAboutWe#
PeerIndex#
DataRobot#
OkCupid#
Lovely#
Data Publica#
Machinalis#
Scikit-learn是Machinalis所有机器学习项目的基石。它拥有一致的API、广泛的算法选择以及大量处理样板代码的辅助工具。我们已在生产环境中将其用于各种项目,包括点击率预测、信息提取,甚至数羊!
事实上,我们使用它的频率如此之高,以至于我们开始将常见用例固化为Python软件包,其中一些已开源,例如FeatureForge。用一句话形容scikit-learn:太棒了。
Rafael Carrascosa,首席开发者
solido#
Scikit-learn正在通过Solido助力摩尔定律。Solido创建的计算机辅助设计工具被前20大半导体公司和晶圆厂中的大多数使用,用于设计智能手机、汽车等内部的尖端芯片。Scikit-learn帮助为Solido的稀有事件估计、最坏情况验证、优化等算法提供支持。在Solido,我们特别青睐scikit-learn的高斯过程模型、大规模正则化线性回归和分类库。Scikit-learn提高了我们的生产力,因为对于许多机器学习问题,我们不再需要“自行编写”代码。这篇PyData 2014演讲中有详细信息。
Trent McConaghy,Solido设计自动化公司创始人
INFONEA#
Dataiku#
我们的软件,数据科学工作室(DSS),使用户能够创建结合了ETL与机器学习的数据服务。我们的机器学习模块集成了许多scikit-learn算法。scikit-learn库与DSS完美集成,因为它为几乎所有业务场景提供算法。我们的目标是提供一个透明且灵活的工具,使得优化构建数据服务、准备数据以及在所有类型数据上训练机器学习算法的耗时环节变得更加容易。
Florian Douetteau,Dataiku首席执行官
奥托集团#
在奥托集团,作为全球五大B2C在线零售商之一,我们日常工作的各个方面都使用scikit-learn,从数据探索到机器学习应用的开发再到这些服务的生产部署。它帮助我们解决从电子商务到物流领域的机器学习问题。其一致的API使我们能够围绕它构建Palladium REST-API框架,并持续交付基于scikit-learn的服务。
Christian Rammig,奥托集团数据科学主管