Page 1 of 1

商业智能与机器学习

Posted: Sun Jan 26, 2025 3:10 am
by arzina221
使用 Redshift,您可以混合搭配节点来找到性能和价格的完美平衡。

BigQuery 的定价 模式完全不同,并且略有争议。

“使用 BigQuery,您可以按查询付费,而不是按小时付费。”
您无需按小时付费,而是按每个查询付费。


根据您的业务,BigQuery 定价模式要么是巨大的优势,要么是潜在的灾难。
如果您使用数据仓库进行业务分析(每天运行数十甚至数百个查询),BigQuery 成本很快就会失控。

但是,如果您仅偶尔运行查询(例如在机器学习研究期间),BigQuery 的定价模型就非常适合您。

您还可以通过插槽预先支付 BigQuery 处理能力费用。在这种定价模式下,您每月支付固定数量的处理能力费用。

Redshift 和 BigQuery 的定价也因地区而异。

从源到 Redshift 和 Snowflake 的无忧复制

商业智能和机器学习是数据仓库最常见的两种用例。从定价角度来看,Redshift 在 BI 部门具有明显优势。它的按小时使用量定价模型迎合了查询频繁的用户。

从定价角度来看,Redshift 在 BI 部门具有明显优势。其按小时计费的定价模式迎合了查询频繁的用户。
例如,如果您像 99Designs一样 需要实时业务分析仪表板,那么 Redshift 就是适合您的仓库。

对于机器学习用例,BigQuery 的优势更加明显。BigQuery 的 ML Engine 和 Redshift Sagemaker 在机器学习和数据科学应用方面展开了激烈较量。

以下是Quora 上 Ashish Awasthi对 ML Engine 和 Sagemaker 的精彩比较:

“AWS 和 Google Cloud 都针对‘使用自己的数据训练自定义模型’用例提供了以下机器学习服务:

Jupyter 笔记本,后端在云虚拟机上运行,​​预装了机器学习框架和云服务客户端。

托管模型训练和超参数优化服务,可远程提交训练作业。可在云提供的 UI 上监控作业。

用于推理的模型存储库和可扩展的模型托管服务。

内置算法(模型架构、参数调 美国海外华人电话号码数据 整和数据增强)仅使用数据来训练您的模型。

Google 云将服务 1(如上所列)称为“ DataLab ”,服务 2 和 3 称为“ ML Engine ”,服务 4 称为“ AutoML ”。AWS 以SageMaker名称运行所有这些服务。

但还是存在一些差异。

对于上面列表中的托管训练(用例 2),ML 引擎仅支持 Tensorflow、scikit-learn、PyTorch 和 XGBoost 框架。在 SageMaker 上,您也可以使用 MXNet、Chainer 和 SparkML。

在 ML 引擎中,您可以使用“tf.data”(内部使用无服务器 Dataflow 框架)在模型执行代码中将数据聚合作为数据预处理的一部分。在 SageMaker 中,需要外部 Spark 作业来执行此操作。

您可以在 ML 引擎上获得 Tensorflow 的新版本,比在 SageMaker 上获得新版本早几周。