相关文章
自建大数据平台迁移腾讯云EMR最佳实践
2024-11-10 16:53

1890c133be7b33590a3eb83c85f2cba4.gif

自建大数据平台迁移腾讯云EMR最佳实践

自建开源大数据平台会随着企业数据的增长遇到:性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop对比优势、自建迁移上云的实践案例来介绍 EMR 是如何解决这些问题的。

弹性 MapReduce (EMR) 是基云原生技术和泛 Hadoop 生态开源技术的安全、低成本、高可靠的开源大数据平台,组件完全源于开源社区,您可以将现有 IDC 或云上自建的大数据集群无缝平滑迁移至腾讯云EMR上。

腾讯云 EMR 产品集成了社区中常见的热门组件,包括但不限于 Hadoop、Hive、Hbase、Spark、Presto、Impala、Flink、Sqoop、Hue、Iceberg、Starrocks 等,可以满足您对大数据在线业务、离线/在线数据仓库、云原生数据湖构建、实时流式计算等全方位场景的需求。

腾讯云弹性 EMR 核心产品能力如下图所示

2e768ac743681292bd117d85d06dc1a8.png

● EMR集成了30+开源大数据组件,提供Hadoop2/3的多版本组件集供用户选择,您可以根据场景按需选择使用的组件,一键分钟级拉起云上大数据平台。

● 云原生大数据平台支持存储计算分离架构,解决传统自建平台扩容滞后、资源利用率低的挑战。存算分离架构下可实现基于COS数据分层存储,计算资源弹性按需使用,提升资源利用率,降低闲置成本。

● 在您使用过程中,可以通过EMR控制台界面可视化管理集群,包括服务启停、配置管理、脚本下发等;并提供涵盖集群、节点、服务累计1000+丰富监控指标,支持多渠道配置告警;EMR也提供了Yarn作业查询、Impala查询分析、HDFS文件存储分析等高阶洞察功能,帮助您显著提升大数据集群及业务运维效率。

相比使用开源Hadoop发行版本自建大数据平台,腾讯云EMR有以下主要优势

1)  集群轻松构建、运维管理功能丰富易用,便于使用及维护

i. 基于开源Hadoop发行商软件构建大数据平台周期长,技术复杂度高,配套开发、运维、监控等工具不完善,且无法得到有效技术支持,需投入较大人力成本进行支撑及维护。

ii.腾讯云EMR可一键快速构建集群,发行版经过充分兼容性测试验证;控制台提供丰富运维、监控工具开箱即用,大幅降低使用及运维成本;除此之外腾讯提供的专业技术支持,也可以帮助客户快速定位并解决问题。

2)  计算资源按需弹性使用,数据可分层存储,资源利用率高

i. 自建大数据平台在服务器资源上一般需提前预估,并且针对业务峰值做一定的的预留,导致资源利用率低,面临计算需求的潮汐变化应对也非常不灵活。

ii. 腾讯云EMR支持灵活的弹性伸缩,资源按需使用,分钟级即可完成扩缩,并且可以根据业务变化的负载或者时间周期进行计算资源自动伸缩。初次之外,您的大数据服务也可以部署在容器服务上;存储方面也支持存算分离架构,可以对数据分层存储,为客户大幅降低存算资源成本。

3) 开源组件持续加固优化,稳定性及性能更有

i. 自建大数据平台一般采用开源社区版本组件,兼容性问题、组件缺陷需自行处理。性能也需自行优化,如需使用社区新版本组件或前沿技术栈搭建及测试成本高。

ii. 腾讯云EMR结合内部大规模实践经验,核心组件如 Hadoop、Hbase 等引入了天穹Oteam 版本,兼容开源并提供有效的稳定性加固。除此之外,新兴技术栈提供丰富优势特性,如 Iceberg 支持 Z-Order 优化可提升场景化性能10倍以上。在云产品敏捷迭代下,用户也可以便捷的基于社区最新稳定版组件构建集群,轻松使用 StarRocks、Iceberg 等新兴实时湖仓技术。

4)全栈安全防护策略,云上环境及数据更安全

i. 自建大数据平台从底层到服务层安全能力需自行构建,复杂度高,覆盖不完整,配套审计能力不完善,存在较多隐患及风险。

ii. 腾讯云 EMR 提供从硬件、网络、操作系统、大数据服务全栈易用的安全防护能力。提供 CVM 主机安全防护,异常告警;支持云硬盘加密,对象存储 COS 加密;网络层面支持 VPC 网络隔离管理,网络安全组设置;集群支持基于 Kerberos+LDAP 安全架构,身份认证确保集群访问安全,并提供基于 Ranger 的多种策略的数据权限管理。

5)无缝对接云生态服务,快速构建完整配套能力

i. 自建大数据平台如数据开发工具等配套能力需自行构建,成本高、周期长。

ii. 腾讯云 EMR 可轻松与 Wedata 数据开发平台、BI 商业智能分析产品无缝对接,帮助客户低门槛、快速构建数据集成、数据开发、数据可视化等服务。除此之外,EMR还支持云监控、云审计等周边服务,助力客户快速构建云上企业智能生态。

589e375b98058f0ee6fd2396f30d5270.png

三、  自建迁移上云最佳实践案例

案例一:某教育头部客户

【客户背景】

该客户是中国国内在线教育引领者,一直致力于用科技手段助力教育普惠,运用人工智能、大数据等前沿技术,为学生、老师、家长提供更高效的学习、教育解决方案,智能硬件产品等。

【核心痛点】

客户在使用腾讯云EMR服务前,主要采取CDH自建方式维护自身开源大数据集群。但随着业务爆发式增长,数据量暴涨,为了应对不同业务场景时效性需求,该客户曾尝试采用众多技术方案并且不断扩容离线集群的规模,还是无法完全满足业务需求,基于CDH自建hive体系的核心报表无法按时产出,严重影响数据分析工作及企业经营决策。

【解决方案】

针对客户海量数据离线数仓时效性以及上云后安全性等核心诉求,腾讯云弹性 MapReduce 提出两种解决方案

湖仓一体方案推动数据湖iceberg技术落地,于腾讯云EMR的Iceberg独有能力,帮助客户将基于hive的PB级报表体系迁移至iceberg数据湖,通过Z-Order优化后报表计算性能显著提升,改善核心报表效率,同时综合降低成本

权限统一方案主导存算分离权限统一方案,基于产品统一权限管控能力,增加扩展能力,该方案中将对象存储(cos)作为权限管控的一种资源,统一权限管理,解决权限管控不统一问题

【迁移效果】

场景化查询效率提升10倍通过腾讯云弹性 MapReduce 的Iceberg特性优化、缓存加速、存算分离智能分层等应用,提高场景化查询了近10倍性能。另外通过腾讯云EMR提供的Iceberg外部Matastore功能,降低了客户元数据改造成本,几乎零改造实现Iceberg元数据接入。

固定算力降低5000核通过EMR计算节点弹性扩缩、容器资源在离线调度等云原生能力,避免闲置资源浪费、降低综合成本。

案例二:某行业工具头部客户

【客户背景】

中国领军的企业云端商业及营销解决方案提供商,同时也是中国领军的精准营销服务提供商。为更好服务客户自身BI、搜索、营销、推荐等业务场景,需要一套稳定、高性能的大数据解决方案。

【核心痛点】

由于客户业务发展迅猛、数据量剧增,原来基于黑石物理机+CDH自建的大数据平台逐步出现了黑石节点扩容周期长、CDH组件版本老、不丰富、无法覆盖数据湖等新增业务场景的弊端。同时由于CDH集群组件较多、平均bug修复周期较长,客户不得不投入较多人力进行运维。综合而言为支持业务的快速发展,客户大数据团队不得不在自建集群的扩容、新业务场景支持、平台稳定性与运维等方面投入大量成本与人力。

【解决方案】

腾讯云EMR提供了一键构建集群能力,满足业务高峰时段分钟级别弹性扩缩容,对集群计算和存储组件的深度集成,满足客户多租户认真和表级别、字段级别颗粒度授权能力。

自动扩缩容能力能够基于时间和负载两种策略弹性伸缩计算节点,满足客户在离线和即席分析场景在不同时间段的资源需求。登录鉴权、索引在文档字段级别的权限管理能力,为集群安全访问提供了稳固的保障。集成对象存储COS功能让备份变得简单。多可用区能力为集群提供了在城市电力或网络异常情况下的容灾保障。

【迁移效果】

通过引入腾讯云EMR,客户集群的交付效率提升10倍。

集群分钟级弹性能力帮助客户轻松应对活动期间流量剧增的压力。

腾讯云EMR安全体系让业务的安全性、高可用性获得了更有利的保障。

四、  迁移方案与购买优惠

在决策上云之后,会将数据和分析任务迁移到腾讯云EMR,我们为您提供IDC自建迁移EMR方案实践与定制迁移 EMR 方案。

● 迁移方案实践

领取链接

https://drive.weixin.qq.com/s?k=AJEAIQdfAAod5vyDEGAFcADQaEACc#/preview?fileId=i.1970325010981265.1688850523229527_f.6789599412zz1

● 定制迁移方案

领取链接

https://cloud.tencent.com/apply/p/5tjcbikd2f7

目前购买 EMR 可享受 3年55折优惠。

选购链接https://buy.cloud.tencent.com/emr

    以上就是本篇文章【自建大数据平台迁移腾讯云EMR最佳实践】的全部内容了,欢迎阅览 ! 文章地址:http://nhjcxspj.xhstdz.com/news/872.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://nhjcxspj.xhstdz.com/mobile/ , 查看更多   
最新文章
海南页面seo推广 海南旅游SEO攻略:提升页面曝光度秘籍
在当今数字化时代,互联网已成为企业展示品牌、拓展市场、吸引客户的关键渠道对于海南这一自然风光旖旎、旅游资源丰富的地区而言
浙江seo推广技术公司(浙江seo推广技术公司排名)
大家好,今天小编关注到一个比较有意思的话题,就是关于浙江seo推广技术公司的问题,于是小编就整理了2个相关介绍浙江seo推广技
教师职责全解析:引导智慧与塑造未来的使命
教师职责全解析:引导智慧与塑造未来的使命 在当今社会,教育不仅仅是知识的传递,更是人类智慧的启迪和未来的塑造。教师在这一过程中扮演着无与伦比的角色。教师不仅是课堂知识的传授者,更是思想的传播者、品格的塑造者以及灵魂的引导者
上海旅游攻略:2日游最佳路线推荐
探索魅力上海的第一天 提到上海,首先映入脑海的或许是那璀璨的夜景和摩登的城市气息。对于首次前往上海的游客来说,充分利用两天的时间来感受这座城市的独特韵味至关重要。第一天的行程,将带你从历史悠久的外滩开始,感受上海的过往与现
海底捞大学生遇挑战如何应对
海底捞大学生遇挑战如何应对 作为一家知名的火锅连锁品牌,海底捞一直以优质的服务和创新的经营模式受到广大消费者的喜爱。然而,如今面对激烈的市场竞争,尤其是在大学生群体中,海底捞也遇到了一些挑战。本文将探讨海底捞在大学生市场中
AI写作时代:论文重复率居高不下的背后真相与解决之道
引言:AI写作时代的到来 近年来,人工智能技术的迅猛发展,推动了AI写作在各个领域的广泛应用。无论是企业文案、学术论文,还是个人创作,AI写作工具都已成为许多作者的得力助手。然而,随着这种工具的普及,学术界却面临着一个棘手的问题
初中体育训练方法与技巧详解
引言 初中阶段是青少年身体发育的关键时期,体育锻炼不仅能促进学生的身体健康,还可以培养他们的团队合作精神和竞争意识。然而,许多学校和家长在关注学生学业的同时,往往忽视了体育训练的重要性。本文旨在详细探讨初中体育训练的方法与
旅游景区质量评定管理规定
探索自然之美,品味历史之韵 旅游景区作为休闲度假的热门选择,其质量评定管理尤为重要。只有经过严格的评定和管理,游客才能安心畅游,尽情享受大自然的奇观和历史的瑰宝。 优质服务,贴心体验 在旅游景区质量评定管理规定下,景区将秉承
用百度AI视频生成工具轻松创意出炉!
百度AI视频生成工具让创意触手可及 在当今数字化时代,视频营销已经成为推广品牌和产品的最佳方式之一。然而,制作一部具有吸引力和创意的视频并非易事。百度AI视频生成工具的出现,让创意触手可及,让您轻松打造出炉的创意作品。 无需复杂
深入解析社区团购平台现状:市场挑战与机遇并存的未来展望
引言:社区团购的崛起 近年来,社区团购这一新兴商业模式越来越受到消费者和创业者的关注。作为一种以社区为基础的团购形式,社区团购通过为周边居民提供便利的购物渠道,实现了高效的交易模式。尤其是在疫情期间,社区团购展现出了强大的
相关文章