快递查询网站建设,网络域名怎么设置,秦皇岛网站制作与网站建设,工商法律网站建设简介#xff1a; DataWorks功能实践系列#xff0c;帮助您解析业务实现过程中的痛点#xff0c;提高业务功能使用效率#xff01;
往期回顾#xff1a;
DataWorks 功能实践速览01期——数据同步解决方案#xff1a;为您介绍不同场景下可选的数据同步方案。DataWorks 功…简介 DataWorks功能实践系列帮助您解析业务实现过程中的痛点提高业务功能使用效率
往期回顾
DataWorks 功能实践速览01期——数据同步解决方案为您介绍不同场景下可选的数据同步方案。DataWorks 功能实践速览02期——独享数据集成资源组为您介绍进行数据同步时可使用的资源组与网络连通方案、注意事项。
通过前两期的介绍您可以了解使用DataWorks进行数据同步的主要知识点数据同步方案和资源组而在实际应用过程中我们常常会需要将开发和生产环境进行隔离开发环境用于数据同步测试生产环境用于生产数据的同步处理。本期就为您介绍DataWorks实现开发与生产环境隔离的主要知识点。 功能推荐标准模式——开发环境与生产环境隔离
为方便不同安全管控要求的用户生产数据DataWorks为您提供简单模式和标准模式两种工作空间模式其中简单模式无法设置开发环境和生产环境而标准模式同时提供开发环境与生产环境并将两个环境隔离开您可以分别在开发环境和生产环境中进行数据任务处理。
Part1简单模式与标准模式的DataWorks工作空间
首先为您介绍两种模式工作空间的主要区别。 简单模式 标准模式 在简单模式工作空间下一个DataWorks空间下层对应一个MaxCompute项目或一个EMR集群、Hologres数据库等)该环境即视为生产PROD环境。 在标准模式工作空间下一个DataWorks空间下层对应两个MaxCompute项目或两个EMR集群、Hologres数据库等)一个视为开发DEV环境一个视为生产PROD环境。
由上可见DataWorks的标准模式工作空间可以将开发、生产环境进行隔离因此如果您使用了标准模式后进行数据访问与权限管控时开发环境与生产环境的使用注意事项不一致。
Part2不同模式工作空间的数据访问
您可以在DataWorks的工作空间配置 计算引擎信息区域设置不同模式下工作空间的数据访问模式。 计算引擎类型 环境 标准模式工作空间 简单模式工作空间 开发环境即生产环境 MaxCompute 开发环境 页面运行任务不可选默认为执行任务者当前登录者 页面运行任务不可选默认为执行任务者当前登录者 调度访问身份可选 阿里云主账号阿里云RAM角色任务负责人任务Owner账号的身份 生产环境 调度访问身份可选 阿里云主账号阿里云RAM用户阿里云RAM角色 E-MapReduce 开发环境 快捷模式下访问身份统一使用集群内的Hadoop用户。安全模式下访问身份任务执行者 快捷模式下访问身份统一使用集群内的Hadoop用户。安全模式下访问身份可选 任务责任人阿里云主账号 阿里云RAM用户 生产环境 快捷模式下访问身份统一使用集群内的Hadoop用户。安全模式下访问身份可选 任务责任人阿里云主账号 阿里云RAM用户 Hologres 开发环境 页面运行任务不可选默认为执行任务者当前登录者。 页面运行任务不可选默认为执行任务者当前登录者 调度访问身份可选 阿里云主账号阿里云RAM用户 生产环境 调度访问身份可选 阿里云主账号阿里云RAM用户
Part3不同模式工作空间的权限管理特征
DataWorks采取RBAC权限模型供用户管理DataWorks所有页面可见功能以及API的使用权限同时这套权限体系与MaxCompute的RBAC角色体系存在天然的映射关系详情可参见 成员及角色管理与成员角色与权限关系。不同工作空间类型的权限管理特征与优缺点不一致以下表格为您对比介绍两种空间类型的权限细分特点。 细分特点 简单模式 标准模式 权限概述 在简单模式空间下DataWorks的“开发”角色因为与所绑定MaxCompute项目的“Role_Project_Dev” Role进行了映射因此DataWorks开发角色天然能够读取MaxCompute项目内的所有数据。 在标准模式空间下DataWorks的“开发”角色因为与所绑定MaxCompute项目dev环境的“Role_Project_Dev” Role进行了映射因此 DataWorks开发角色天然能够读取MaxCompute项目dev环境内的所有数据。由于没有和MaxCompute项目PROD环境的role映射因此默认情况下DataWorks开发角色无MaxComputePROD环境的数据权限。 优点 简单、方便、易用。 仅需要授权数据开发人员“DataWorks开发角色”即可完成所有数据仓库开发工作。 安全、规范。 具备安全、规范的代码发布管控流程包含代码评审、代码DIFF查看等功能保障生产环境稳定性避免不必要的因代码逻辑引起的脏数据蔓延或任务报错等非预期情况。数据访问得到有效管控数据安全得以保障。 缺点 存在不稳定、不安全的风险。 开发角色可以不经过任何人审批随时新增、修改代码并提交至调度系统给生产环境带来不稳定因素。面向MaxCompute计算引擎时开发角色默认拥有当前MaxCompute项目所有表的读写权限可随意对表进行增加、删除和修改等操作存在数据安全风险。 流程相对复杂一般情况下无法一人完成所有数据开发、生产流程。
MaxCompute引擎在不同模式下数据库表命名规范
简单模式下不区分开发环境和生产环境开发库即生产库。标准模式下支持开发环境和生产环境隔离开发环境和生产环境的数据库表命名有所区别如果需要在开发环境访问生产环境的数据库表请根据以下命名规范严格区分数据库表名避免误操作生产环境。 环境类型 标准模式 示例 开发环境 项目名_dev.表名 在projectA项目下创建一个开发库表user_info则数据库表名为projectA_dev.user_info。 生产环境 项目名.表名 在projectA项目下创建一个生产库表user_info则数据库表名为projectA.user_info。
更多的简单模式与标准模式的区别可前往帮助中心。
场景实践
权限管理与规范化数据开发通过本实践您可以了解使用标准模式的工作空间时用户进行数据开发的标准流程与权限管控建议。
原文链接
本文为阿里云原创内容未经允许不得转载。