服务电话:133921763
当前位置: 5050论坛 > 5050平码论坛 > 正文

Oracle 大数据机和毗连器产物支撑取 Hadoop 和 Clo

发表时间: 2019-05-11

  支撑从 Oracle 数据库中曲连正在 HDFS 上的数据,而且通过正在 Oracle 数据库中建立某外部表,用户可以或许从 HDFS 拜候和导入数据。正在 HDFS 中存储的数据可通过 SQL 进行查询,这些数据会取 Oracle 数据库中存储的数据相联系关系,或被加载至 Oracle 数据库中。HDFS 中的数据能够存正在于界定文件中,或者是由 Oracle 加载器为 Hadoop 建立的 Oracle 数据 pump 文件中。

  该适配器供给了取 ODI 的原始 Hadoop 集成。ODI 模块可用于正在 ODI 内部建立 Hadoop 元数据、加载数据到 Hadoop、正在 Hadoop 内部转换数据以及操纵针对 Hadoop 的 Oracle 加载器间接将数据加载到 Oracle 数据库中。

  包含正在大数据机包中的 Cloudera Manager 供给一个集群范畴的、及时的运转节点及办事视图,它可以或许用来改变跨集群内的设置装备摆设。它还包罗了演讲和诊断东西来察看集群的机能和操纵率。

  该组件是一个 R 言语包,用来帮帮拜候 Hadoop 以及存储正在 HDFS 中的数据。它可用于建立 R 模块来应对利用 MapReduce 处置的海量数据。

  这是一种 MapReduce 使用,用以优化从 Hadoop 下载到 Oracle 数据库中的数据。它能够用来正在 Hadoop 中对数据进行筛选、分区以及转换成 Oracle 数据库的数据格局。它还能够以 Hadoop 集群中的一项 Hadoop 使命的形式来对数据进行预处置,然后再将转换过的数据加载入数据库中。该特征同样支撑正在线或离线选项,负载平衡及多种输入格局(如定界文本文件、Hive表以及自定义格局)。

  Oracle 的大数据毗连器软件产物可操纵 Oracle 数据库 11g 整合储存正在 Hadoop 及 Oracle NoSQL 数据库中的数据。通过正在 Hadoop 数据上间接利用 Oracle 的开源 R 言语可实现对数据的阐发。大数据毗连器软件包包含以下组件:

  相关链接: