当前位置 博文首页 > weixin_49470452的博客:企业-Cassandra-deployments-part-2-clo
如果您必须使用EBS卷,请使用“EBS优化实例”,使用“已调配的IOPS”,并在不同的卷上拆分数据和提交日志。
临时存储是一个很好的选择,可用于下游的卡珊德拉环境,如测试/开发、试运行等。 由于临时卷通常是固态硬盘,因此不需要将数据和提交数据分离到单独的驱动器中。 为了优化性能,请选择带有多个临时存储驱动器的EC2实例,并将它们一起条带化到一个逻辑卷中。 向逻辑卷发送数据和提交。 请记住,当您停止EC2实例时,临时存储中的数据将被删除。
将所有临时驱动器分条到单个卷中,以获得最高性能。
卡桑德拉使用“飞贼”来确定集群的拓扑结构。 金色飞贼还用于确定群集中每个节点的“数据中心”和“机架”。 “复制策略”用于确定数据在集群中不同节点的位置。
AWS和GCP都提供了一系列的操作功能,这使得在Apache Cassandra集群上保持高正常运行时间变得更加容易。 必须根据您的部署需求仔细选择这些功能。
企业组织必须备份数据。 数据丢失的影响如此之大,以至于没有一家企业愿意冒险单独依赖复制。 在公共云环境中保护数据可能看起来令人望而生畏,但与本地部署相比,有几个选项可以让这变得更容易。 一个简单的选项可能看起来像本机快照之一:
我发现很少有客户使用EBS卷的“快照”来保护其群集中的数据免受逻辑和/或操作错误的影响。 这种解决方案可以工作,但有一些严重的限制。 除了维护脚本以拍摄快照的开销之外,存储成本也有很大的开销。 拍摄卷的快照不允许对数据进行增量备份。 这导致快照中存储的数据量呈指数级增长,从而导致备份解决方案的高成本。
Amazon S3或Google Cloud Storage
以下是使用S3时的一些建议:
在本文中,我们研究了各种最佳实践,以提高公共云(Amazon或Google Cloud)中Cassandra部署的运营效率。