Games Data Forum

Posted: **Sun Jan 26, 2025 3:10 am**

使用 Redshift，您可以混合搭配节点来找到性能和价格的完美平衡。

BigQuery 的定价模式完全不同，并且略有争议。

“使用 BigQuery，您可以按查询付费，而不是按小时付费。”
您无需按小时付费，而是按每个查询付费。

根据您的业务，BigQuery 定价模式要么是巨大的优势，要么是潜在的灾难。
如果您使用数据仓库进行业务分析（每天运行数十甚至数百个查询），BigQuery 成本很快就会失控。

但是，如果您仅偶尔运行查询（例如在机器学习研究期间），BigQuery 的定价模型就非常适合您。

您还可以通过插槽预先支付 BigQuery 处理能力费用。在这种定价模式下，您每月支付固定数量的处理能力费用。

Redshift 和 BigQuery 的定价也因地区而异。

从源到 Redshift 和 Snowflake 的无忧复制

商业智能和机器学习是数据仓库最常见的两种用例。从定价角度来看，Redshift 在 BI 部门具有明显优势。它的按小时使用量定价模型迎合了查询频繁的用户。

从定价角度来看，Redshift 在 BI 部门具有明显优势。其按小时计费的定价模式迎合了查询频繁的用户。
例如，如果您像 99Designs一样需要实时业务分析仪表板，那么 Redshift 就是适合您的仓库。

对于机器学习用例，BigQuery 的优势更加明显。BigQuery 的 ML Engine 和 Redshift Sagemaker 在机器学习和数据科学应用方面展开了激烈较量。

以下是Quora 上 Ashish Awasthi对 ML Engine 和 Sagemaker 的精彩比较：

“AWS 和 Google Cloud 都针对‘使用自己的数据训练自定义模型’用例提供了以下机器学习服务：

Jupyter 笔记本，后端在云虚拟机上运行，预装了机器学习框架和云服务客户端。

托管模型训练和超参数优化服务，可远程提交训练作业。可在云提供的 UI 上监控作业。

用于推理的模型存储库和可扩展的模型托管服务。

内置算法（模型架构、参数调美国海外华人电话号码数据整和数据增强）仅使用数据来训练您的模型。

Google 云将服务 1（如上所列）称为“ DataLab ”，服务 2 和 3 称为“ ML Engine ”，服务 4 称为“ AutoML ”。AWS 以SageMaker名称运行所有这些服务。

但还是存在一些差异。

对于上面列表中的托管训练（用例 2），ML 引擎仅支持 Tensorflow、scikit-learn、PyTorch 和 XGBoost 框架。在 SageMaker 上，您也可以使用 MXNet、Chainer 和 SparkML。

在 ML 引擎中，您可以使用“tf.data”（内部使用无服务器 Dataflow 框架）在模型执行代码中将数据聚合作为数据预处理的一部分。在 SageMaker 中，需要外部 Spark 作业来执行此操作。

您可以在 ML 引擎上获得 Tensorflow 的新版本，比在 SageMaker 上获得新版本早几周。

Games Data Forum

商业智能与机器学习

商业智能与机器学习