北京时间 2022 年 6 月 16 日,Apache 软件基金会宣布 Apache Doris 正式毕业,成为 Apache 顶级项目。
北京时间 2022 年 6 月 16 日,Apache 软件基金会宣布 Apache Doris 正式毕业,成为 Apache 顶级项目。作为国人主导的新兴数据仓库及数据分析类开源项目,Apache Doris 本次成功毕业是百度长期支持和践行开源理念的一项重要里程碑。
目前,Apache Doris 已经在互联网、金融、电商、教育、文娱等多个行业得到广泛应用,成长为业界广受欢迎的开源实时数仓之一。
Apache Doris 的成长史——为数据分析而生的十四年
Doris 是由百度自研并捐赠至 Apache 软件基金会的开源 MPP 数据库,它的前身是百度 PALO。PALO 这一名称,来源于其核心场景 OLAP(在线分析处理)的字母倒序。百度 PALO 团队与 Doris 一起,走过了为数据分析而生的十四年。
2008 年,Doris 在百度诞生,定位为高性能分析型数据库,大幅提升了百度凤巢业务的数据分析时效性。
2009 年,Doris 开始支持百度内部其他报表系统,并助力百度统计成为国内最大的中文网站分析工具。
2012 年,Doris 成长为百度首个公司级 OLAP 分析平台并正式改名 PALO(OLAP 的反写)。
2013 年,PALO 升级新一代 MPP 分布式架构及高性能数据模型,各项核心技术指标大幅提升。
2017 年,PALO 正式对外开源,同年在百度智能云发布「百度数据仓库 PALO」云服务。
2018 年,百度将 PALO 的核心引擎捐赠给 Apache 软件基金会,并命名为 ApacheDoris,百度 PALO 团队开始全力推进 Doris 社区发展。
2020 年,在百度 PALO 团队与社区伙伴的共同努力下,Apache Doris 社区走上发展快车道,荣获 2020 年度 OSC 中国开源项目「最佳人气项目」,2020 InfoQ 中国技术力量年度榜单「十大开源新锐项目」,2020 年度开源中国「中国开源项目 Top10」等开源奖项。
2021 年,Doris 各项核心能力大幅增强,行业影响力进一步提升,成为中国信通院 2021 年「OSCAR 尖峰开源项目及社区」,获得「首批可信开源社区共同体(TWOS)」正式成员认证。
2022 年,百度正式完成商标捐赠,推进 ApacheDoris 完成毕业,正式成为 Apache 软件基金会顶级项目。
百度 PALO 与社区共同成长
毕业意味着新的开始,也意味着新的责任。据悉,百度 PALO 团队将一如既往地全力支持和贡献社区,将在实践中所收获的产品能力与社区分享,与社区成员一道将 Apache Doris 建设的更加完善,也让更多人能体验到 Doris 的优秀能力。
在产品技术方面,百度将持续打磨 Doris 的核心能力,保持核心技术指标的领先。其中,在性能方面,百度将全方位打磨或重构现有的核心组件,尤其是社区呼声最高的向量化和优化器,百度将实现完全的面向列的向量化执行引擎,全面淘汰行存,同时,百度将实现全新的 CBO 优化器以及更加精细和丰富的统计信息,这将把 Doris 的性能进一步推向极致。在稳定性和可观测性方面,百度将重点补齐 Doris 的短板,强化 Doris 的 Profiling、Trouble Shooting 等能力,并会持续将百度在大规模生产环境所遇到的各种问题及解决方案贡献到社区,进而帮助 Doris 变得更加稳定。百度还将持续完善 Doris 的各项重要功能以及生态对接能力,其中包括社区呼声最高的众多功能,从而帮助 Doris 变得更加强大和易用。
在社区建设方面,Apache Doris 已经度过了早期萌芽阶段,正在进入高速发展期。一方面,百度将进一步强化社区的运营投入,让 Doris 能被更多的贡献者、开发者以及用户所知道,努力构建一个多元、繁荣和国际化的社区;另一方面,随着社区的扩张,以及商业诉求的增长,百度将建立或完善社区的各项规章制度和行为准则,让各方都能在 Apache Way 的指导下参与社区,保障 Doris 社区能够良性和健康的发展。
在商业方面,百度将围绕 Apache Doris 持续完善商业产品「PALO 数据仓库」。相比开源的 Doris 引擎,PALO 数据仓库可提供大规模生产级的稳定性、完善的企业级特性、易用的管控和访问平台、无感升级等专有特性,用户也可享受到来自原厂资深专家的专业技术支持服务。除此之外,百度全新推出的 PALO Cloud 产品将支持先进的多云原生能力,提供完善的云原生,以及多云和跨云能力,帮助用户拥抱云和多云时代。同时,PALO Cloud 的在离线融合、湖仓融合等能力将帮助用户构建以数据为中心的新一代全场景统一湖仓,为企业提供数据的统一视图、统一访问,真正释放数据的价值,正如 PALO 的寓意那样能够「玩转 OLAP」。
来源:朝闻天下