写点什么

亚马逊云科技 AI 创新应用下的托管在 AWS 上的数据可视化工具—— Amazon QuickSight

作者:淼.
  • 2023-11-18
    山东
  • 本文字数:2993 字

    阅读完需:约 10 分钟

亚马逊云科技AI创新应用下的托管在AWS上的数据可视化工具—— Amazon QuickSight

Amazon QuickSight 简介


亚马逊 QuickSight 是一项可用于交付的云级商业智能 (BI) 服务 easy-to-understand 向与您共事的人提供见解,无论他们身在何处。亚马逊 QuickSight 连接到您的云端数据,并合并来自许多不同来源的数据。在单个数据仪表板中,QuickSight 可以包括 AWS 数据、第三方数据、大数据、电子表格数据、SaaS 数据、B2B 数据等。作为一项完全托管的基于云的服务,亚马逊 QuickSight 提供企业级安全性、全球可用性和内置冗余。它还提供了从 10 个用户扩展到 10,000 个用户所需的用户管理工具,所有这些工具都无需部署或管理基础架构。

QuickSight 让决策者有机会在交互式视觉环境中探索和解释信息。他们可以从您网络上的任何设备和移动设备安全访问仪表板。

Amazon QuickSight 的独特之处

以下是使用亚马逊的一些好处 QuickSight 用于分析、数据可视化和报告:

  • 内存引擎,称为 SPICE,以惊人的速度响应。

  • 没有许可证的前期成本,总拥有成本 (TCO) 也很低。

  • 无需安装应用程序即可进行协作分析。

  • 将各种数据合并为一项分析。

  • 以仪表板的形式发布和共享您的分析。

  • 控制功能在仪表板中可用。

  • 无需管理精细的数据库权限,仪表板查看者只能看到您共享的内容。



对于高级用户,QuickSight 企业版提供更多功能:

  • 借助由机器学习 (ML) 提供支持的自动化和可自定义的数据见解,为您节省时间和金钱。这使您的组织无需任何机器学习知识即可完成以下操作:

  • 自动做出可靠的预测。

  • 自动识别异常值。

  • 找出隐藏的趋势。

  • 根据关键业务驱动因素采取行动。

  • 将数据转换为 easy-to-read 叙述,例如仪表板的标题图块。

  • 提供额外的企业安全功能,包括:

  • 使用联合用户、群组和单点登录(IAM 身份中心)AWS Identity and Access Management(IAM) 联邦、SAML、OpenID Connect 或 AWS Directory Service for Microsoft Active Directory。

  • AWS 数据访问的精细权限。

  • 行级安全。

  • 高度安全的静态数据加密。

  • 访问 Amazon 虚拟私有云中的 AWS 数据和本地数据

  • 优惠 pay-per-session 为您置于 “读者” 安全角色的用户定价—读者们是仪表板订阅者,即查看报告但不创建报告的人。

  • 赋予你创作能力 QuickSight 通过部署嵌入式控制台分析和仪表板会话,成为您自己的网站和应用程序的一部分。

  • 为分析服务的增值经销商 (VAR) 提供多租户功能,使我们的业务成为您的业务。

  • 使您能够以编程方式编写可转移到其他 AWS 账户的控制面板模板脚本。

  • 使用分析资产的共享和个人文件夹,简化访问管理和组织。

  • 为以下对象启用更大的数据导入配额 SPICE 数据摄取和更频繁的数据刷新。



Amazon QuickSight 注册

  • 为了使用 QuickSight,需要拥有一个有效的 AWS 账户。 如果没有 AWS 账户,访问 http://console.aws.amazon.com/并首先创建一个账户。 登录到 AWS 控制台后,搜索 QuickSight 并单击链接,如下所示:


  • 将被导航到 Amazon QuickSightt 的门户,将特别要求在其中注册该服务。 单击“ 注册 QuickSight”,然后继续进行。 在下一页上,可以选择版本。 我这里选择标准版 ,然后单击继续


  • 在下一页上,将需要提供 QuickSight 服务的帐户名和一个可以接收通知的电子邮件地址完成后,单击完成。


  • 该过程可能需要花费几分钟,一旦完成,将收到一条消息,提示成功注册 Amazon QuickSightt。


Amazon QuickSight 使用

  • 单击转到 Amazon QuickSightt 以启动服务。 将被导航到其他服务,在其中可以看到 QuickSight 正在加载一些已经准备好的示例分析。


  • 只是为了对样本分析有所了解,让我们继续打开列表中可用的 Sales Pipeline 分析 。 所见,将启动一个新的分析,将能够按照以下方式查看报告。

Redshift 和 Amazon QuickSightt 平台构建数据可视化应用程序

  • 创建 Redshift 集群

  • 将 S3 的数据文件批量装载到 Redshift 数据库

  • 使用 Quicksight 对数据表进行可视化

本程序的架构图如下图所示:

构建数据仓库

  • 查看数据


  • 创建 IAM Role

选择 IAM 服务,点击角色->创建角色,选择 Redshift

选择 Redshift-Customizable,点击下一步权限


添加权限名字 myRedshiftRole,点击确认



  • 创建子网组

创建 Redshift 集群前,先创建子网组。选择 Redshift 服务,在左边菜单条中选择“CONFIG”->”管理子网组“


然后选择“创建集群子网组”,子网组名称可接受缺省名字“cluster-subnet-group-1“,在描述框中输入任意说明文字。选择“默认 VPC”,选择“为此 VPC 添加所有子网“,然后点击“创建集群子网组”完成创建子网组。



  • 创建 Redshift 集群

在左侧菜单中选择“集群”,点击“创建集群“,设置集群的名字(不要用中文,不要用特殊字符,英文开头,可以有数字,可以有减号),节点类型选择 dc2.large



数据库配置接受缺省值,输入主用户密码(请记住您输入的密码)



集群权限中,选择前面创建的 myRedshiftRole 角色,点击“Associate IAM role”



其它配置中,选择默认 VPC,缺省安全组和之前创建的集群子网组,点击确认“创建集群”,大约 5 分钟后,集群变为“Available”状态。

  • 访问 Redshift 数据库

有两种方式访问 Redshift 数据库,一种是通过 Redshift Console 上的查询编辑器,一种是通过 SQL 客户端(例如 SQL Workbench/J 客户端)。本实验中为了简便操作,使用 Redshift Console 上的查询编辑器来访问数据库。选择左边菜单中“编辑器”,在“连接到数据库”窗口中输入一下参数,然后“连接到数据库”



  • 创建表

在查询编辑器中创建表,在左边 Select Schema 中选择“Public”,然后在 SQL 查询窗口中输入创建表的 SQL 语句:


create table table1(    tno varchar(20),    tdate varchar(15),    uno varchar(10),    pno varchar(10),    tnum int,    uname varchar(20),    umobile varchar(20),    ano varchar(20),    acity varchar(50),    aname varchar(50),    pclass varchar(10),    pname varchar(50),    price decimal(10, 2));
复制代码



  • 导入 S3 数据

新开一个 SQL 查询窗口(此处为 Query 2),输入下面装载 S3 数据的 SQL 命令,注意要将帐号替换为实际的帐号 ID,并确认争取的 S3 桶地址。


copy table1 from 's3://lab-921283538843-wzlinux-com/spark/output/' credentials 'aws_iam_role=arn:aws:iam::921283538843:role/myRedshiftRole' format as parquet;
复制代码



点击运行,结果应显示为“Completed”。在 Query3 中 输入”select from table1;”应查询中表中的数据。在 Query4 中输入“select count() from table1; “,应查询到表中的数据。这说明 S3 中的数据已完成 copy 到 Redshift 数据仓库中。



  • 允许 Internet 访问

下一步,我们将使用 AWS Quicksight 将 Redshift 中的数据进行可视化展现。在此之前,需要给予 Quicksight 从 Internet 访问 Redshift 的权限。为此,我们先在 EC2 菜单中创建一个公网的弹性 IP 地址(过程略)。然后修改 Redshift 属性,赋予公开访问权限。



将可公开访问改成“是”,选择对应的弹性公网 IP 地址即可。


数据可视化

  • 启用 Quicksight

  • 创建数据集

进入 Quicksight 控制台界面,点击左侧数据集,选择创建“新数据集”



选择 Redshift(自动发现)数据集,Redshift 也有手动连接的方式.



输入连接参数,选择“创建 data source”,选择对应的 Redshift 数据库,注意配置对应的地址,端口,数据库名称,用户名和密码


选择 Table1,点击“Select”,最后点击“Virtualize”完成创建数据集(此处我们选择把数据从 Redshift 导入到 Quicksigh 里面来,这样分析起来速度会快很多)



  • 数据可视化

打开可视化对象窗口,选择展现方式为“竖条状图“

tdate 拖放到 X axis 栏,将 tnum 拖动到 value 栏(系统会自动选择计数)


发布于: 刚刚阅读数: 3
用户头像

淼.

关注

还未添加个人签名 2022-10-24 加入

还未添加个人简介

评论

发布
暂无评论
亚马逊云科技AI创新应用下的托管在AWS上的数据可视化工具—— Amazon QuickSight_淼._InfoQ写作社区