跳到内容

    使用按需gpu加速的Spark/RAPIDS集群运行复杂的工作负载

    Apache Spark是处理大型数据集的事实上的标准, 并越来越多地用于拟合和评分复杂的机器学习模型. gpu加速的工作节点可以大大加快模型训练阶段,同时降低成本(通常是数量级). 尽管数据科学家通常喜欢通过Scala使用Spark, Python, 和R, 发放和维护Spark集群的复杂性是相当大的.

    BB电竞将介绍一个基于Domino Data Science 平台的集成解决方案, 英伟达NGC容器, 以及Apache Spark的RAPIDS Accelerator, 它可以让数据科学家轻松地为Spark/RAPIDS集群提供任意数量的gpu加速worker, 并通过他们喜欢的集成开发环境访问它.

    发言人: Nikolay Manchev - EMEA首席数据科学家,Domino数据实验室

     

    得到视频