白青乡| 安远| 保元| 洛宁| 宝格德乌拉苏木|

IBM Integrated Analytics System加速数据科学发展

标签:长像 木绒

2018-02-21 15:14:00 作者:ChinaBbyte 分类 : 比特网

  加速数据科学发展

  企业是成为行业领导者,还是被竞争对手远远抛在身后,在这其中,能否运用分析能力加快决策过程是决定性因素之一。然而,为企业提供分析能力的过程会因为多种因素而变得复杂,其中包括:

  . 务必让数据科学家参与整个过程,以便能够支持复杂的分析需求(包括机器学习)

  . 必须支持企业现有的多种数据类型,包括非结构化和半结构化数据

  . 物联网 (IoT) 等新用例的出现,要求实现实时分析和流式分析

  . 呈指数级增长的数据持续制造数据“孤岛”,因此必须在企业内部环境和环境中对这类“孤岛”进行有效管理

  . 需要性能卓越、易于扩展的数据仓库基础架构,满足服务级别协议的要求

  为了控制这些因素,同时保护现有投资,企业必须选择具备以下能力的分析和数据仓库解决方案

  . 为数据科学家提供所需的解决方案,最大程度消除开发和部署最先进的分析工作负载时所遇到的困难。

  . 支持多个数据类型、位置以及传统数据仓库、近实时运营工作负载或混合工作负载。

  . 适用于混合数据战略,并提供迁移到云环境的途径。

  . 为任何规模或类型的工作负载提供高性能及可扩展性。

  . 提供云环境所具有的灵活性,但部署在数据中心内。

  投资的解决方案是否适当,对于企业未来能否扩展分析能力而言至关重要。选择是否适合,决定了企业是能够满足服务级别协议的要求,还是遭遇发展瓶颈。

  IBM Integrated Analytics System 提供经过优化、面向云环境的高性能数据平台,帮助数据科学家缩短开发和部署时间,深入挖掘所需的洞察,从而提升竞争力。

  企业的数据科学家可以利用内置了 IBM Data Science Experience 的统一数据科学解决方案,在企业数据存储位置进行数据科学活动。这使得数据科学家能够开发更出色的机器学习分析能力,从性能经过优化的通用 SQL 引擎以及嵌入式 Apache Spark 处理中获益。

  IBM Integrated Analytics System 经过精心设计,几乎不需要任何调优和维护,即可部署和管理各种工作负载,能满足要求最严苛的工作负载所需的超高性能和 PB 级可扩展性。IBM Integrated Analytics System以系统中嵌入的Apache Spark处理引擎支持机器学习,从而实现更高性能的分析。该功能还有助于减少将分析和数据移至不同环境所带来的复杂性。IBM混合数据管理产品系列中共享的通用SQL 引擎能够使用企业现有的内部应用和云应用。这样的灵活性使您可以为特定任务选择合适的环境。

  集成架构结合了软件增强功能,例如,非对称大规模并行处理 (AMPP),还包含 IBM Power. 技术和闪存存储硬件。IBM Integrated Analytics System 可以处理传统数据仓库工作负载以及混合式运营工作负载。这些工作负载通常需要处理针对海量数据的查询、针对小数据集的快速精准查询,此外还需要处理多个并发操作访问。而 IBM Integrated Analytics System 可以通过单一解决方案,支持涉及多种数据类型和位置的广泛分析用例。这样的灵活性能够为数据科学家带来无限可能。

  借助 Spark 实现嵌入式分析和机器学习能力

  IBM Integrated Analytics System 通过嵌入式Apache Spark 处理能力,帮助数据科学家简化训练和评估预测模型的工作。通过这种功能,企业无需耗费大量时间将数据转移至其他系统以及转换为其他格式。数据科学家使用所选的工具开发模型后,就可以在数据存储位置进行测试、部署和训练等工作。由于每个节点都包含自己的 Spark 执行器进程,因此可以最大程度减少延迟,因此与单独的 Spark 集群相比,这有助于加快数据访问和计算速度。对于那些需要数据科学家从系统上卸下工作负载的情况,行业标准工具和通用 SQL 引擎能够将模型无缝移至 Spark 集群。

  这不仅能够简化流程,还可以为分析(包括机器学习)功能实现更卓越的性能和灵活性。数据科学家可以快速与系统中的数据对接,运用 IBM Data Science Experience Local 随附的五种经过授权的用户许可开始构建模型。这种基于云的互动式协作环境使数据科学家能够使用多种工具将洞察付诸实践。数据科学家还可以选择使用Python、R 或 Scala,并可以通过系统中包含的 Jupyter Notebook 容器使用 Jupyter Notebook。Jupyter 可用于执行互动式代码,通过点击式部署,将代码转换为完成编译和部署的Spark应用。

  除了提供用于数据挖掘、预测、转换、统计、地理空间数据和数据准备方面的预置功能外,IBM Integrated Analytics System 内置的 Spark 功能还支持开源 R 以及Python、Java、C、C++ 和 Lua 等其他编程语言。

  IBM Integrated Analytics System 还包含嵌入式 IBM Netezza. Analytics 技术以及多种算法,包括线性回归、决策树聚类、K 均值聚类和兼容 Esri 的地理空间扩展。该系统能够与业务分析及可视化工具协同使用,这些工具包括 IBM Cognos.、SAP BusinessObjects、Kognitio、Microsoft Excel、QlikView、SAS、Microsoft SQL Server Reporting Services (SSRS) 和 Tableau。该系统还可以处理模型构建和评分工具,比如 IBM SPSS.、Fuzzy Logix、开源 R 和 SAS。

  集成与性能

  IBM 凭借 20 多年来与成千上万来自各地区、各行业客户的丰富合作经验,打造卓越设计,帮助企业简化分析系统的部署和管理。对数据中心内的软件和硬件进行配置,使之能够协同工作,组成性能卓越的单一解决方案。只需花费数小时加载数据,无需创建数据库索引,也不必费力调优数据仓库或者在数据仓库运行后进行重新调优。

  使用 IBM Integrated Analytics System 及其随附的 IBM Db2. Warehouse 技术的客户,能够立即发现整个IBM混合数据管理解决方案系列中使用的通用 SQL 引擎所带来的好处。IBM Db2 Warehouse 专为数据仓库和分析工作负载而设计。而通用 SQL 引擎采用动态的内存中列式技术,支持基于 IBM Db2 和 IBM BLU Acceleration. 技术的多种工作负载。BLU Acceleration 大规模并行处理(MPP) 架构旨在用于快速深入地分析海量数据,规模可达 PB 级。与先前系统相比,查询响应速度快了 100 倍,1 BLU Acceleration 列式表可以和传统行式表共存于相同的模式、存储器和内存中,因此可以同时查询行式表和 BLU Acceleration 列式表。BLU Acceleration 技术使传统的内存中功能如虎添翼,使性能更上一层楼,即使数据集超过内存大小,也不会有任何问题。BLU Acceleration 的动态内存中列式技术以及数据忽略功能提供了一种扫描和查找相关数据的有效方法,即使在数据压缩的情况下也不受影响。

  IBM Integrated Analytics System 利用 IBM Power Systems. 和 IBM FlashSystem. 技术,提升硬件的可靠性和性能。目前的 IBM Power 架构支持更密集的系统,只需更少的节点就能获得和先前产品相近的性能。作为系统的默认存储,IBM FlashSystem 可实现超低延迟、接近内存水平的高速 I/O 以及出色的可靠性。

  分析应用以峰值性能持续运行,此外,IBM Integrated Analytics System 还提供更高水平的可靠性,帮助您满足或超越服务级别协议的要求。由于采用容错设计消除单点故障,因此 Power Systems 和 IBM FlashSystem 存储产品的额定正常运行时间显著延长。2017 年的一项信息技术情报咨询 (ITIC) 调研结果显示,IBM Power Systems 在任何主流 Linux 服务器平台上的计划外宕机时间都是最短的(每台服务器每年 2.5 分钟)。

  整个系统中的所有组件都实现冗余,以便确保在硬件发生故障时运行不会间断。该系统还包括额外的内置高可用性,用于提供自动故障转移功能,实现持续的高性能表现。由广泛应用于 Db2 产品家族的 IBM Data Server Manager 支持的内置控制台监控和管理所有组件(包括硬件和软件)。

  面向云环境和数据的混合方法

  “一体适用”式的方法通常无法满足企业的数据处理要求。IBM Integrated Analytics System 基于 IBM 混合数据管理产品家族所使用的通用 SQL 引擎(一系列共享组件和功能),能够在整个基础架构中实现无缝的互操作性。

  例如,团队所使用的数据仓库可能需要迁移至云端,以满足季节性容量需求。如果采用 IBM Bluemix. Lift 等工具,就可以将此工作负载无缝迁移至 IBM Db2 Warehouse on Cloud。通用 SQL 引擎可以确保您无需重写任何应用。

  通用 SQL 引擎始终能够提供数据视图,无论数据位于何处,也无论是非结构化数据还是半结构化数据。通用 SQL 引擎中的系统内置数据虚拟化服务有助于统一整个逻辑数据仓库中的数据访问,支持联合 Db2、Hadoop 甚至第三方数据源。

  可扩展性与扩展选项

  软件和硬件架构都能够随着工作负载的增加而不断扩展,以支持业务发展的需要。计算容量和存储容量可单独扩展,具备云平台那样的灵活性和可扩展性。硬件扩展时无需中断业务,可直接在系统运行时进行。

  IBM Integrated Analytics System 还支持根据数据的使用频率进行分层存储,确保最高水平的性能,即使数据量非常庞大,也不在话下。系统直接在存储节点上管理最近使用和非常活跃的“热”数据,而在更具成本效益的高密度 IBM Storwize. 存储设备上管理存在时间较长、不太活跃的“冷”数据。

  用例

  IBM Integrated Analytics System 采用的通用 SQL 引擎可确保特定工作负载在合适的部署平台上运行,同时确保数据始终可访问,无论其类型、位置或大小。以下是一些用例,您或许可以从中获得一些启示:

  . 通过使用所有参与交互的 Hadoop、数据集市或其他相关部署创建逻辑数据仓库,提供内部和云端数据的统一视图,令卓越运营成为新常态。

  . 借助内部数据以及分析功能,实时营造个性化的客户体验,提供用户所需的高性能和简便的可扩展性。

  . 通过使用嵌入式机器学习加速开展复杂的分析,揭示有关用户的深入洞察,从而加快创新产品的上市速度。

  . 借助能够快速加载数据而且只需很少或根本无需调优、也不需要大量配置工作的系统,更快地为业务用户提供所需的工作负载。

  . 逐步增加混合式运营工作负载,扩展可供业务用户使用的工作负载选项。

  . 以更准确的数据视图,帮助确保运营合规。

  . 使用数据虚拟化技术,构建针对各种不同数据类型和数据集的分析应用,统一涵盖整个逻辑数据仓库和其他技术的数据访问,从而获得更高质量的洞察,促进业务发展。

  产品规格

  IBM Integrated Analytics System 集成并优化了所有计算、存储和网络资源以及分析和数据仓库软件。它以机架配置形式提供,如下表所示。

  关于 IBM 混合数据管理解决方案

  IBM 提供了最全面的混合数据管理解决方案系列之一,旨在帮助企业最大程度发挥信息资产的价值,发掘新锐洞察,以支持更快做出更明智的决策,优化业务成果。

    面向数字化、云计算和认知时代,您是否想拥有一款无边界数据库软件?目前,IBM DB2正发起免费试用活动,如果您恰好感兴趣,快速速报名>>

最近更新
科普

科普图集
互联网+升级到智能+,开启万物智联新时代

互联网+升级到智能+,开启万物智联新时代>>详情

中国互联网消费市场,发展潜力一片大好

中国互联网消费市场,发展潜力一片大好>>详情

邮件订阅

软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
网络周刊
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
存储周刊
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
安全周刊
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家网
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。

天津路口 黄村老街 上海青浦区商榻镇 张庄路街道 拉斯帕尔马斯
苏海图街道 赵家坪乡 大刘寨北 竞丰村 清洋街道