随着大数据时代存算分离新架构的到来,本论坛将从中国联通、网易、Shopee、bilibili的数据加速管理层的应用实践,结合Alluxio带来的数据缓存层的设计、实现与优化,给广大的数据从业者带来全链路数据优化到实现原理的多维度展现。本次论坛还将详细讨论来自通讯、游戏、电商、视频行业的数据挑战,结合Alluxio技术的深入讲解,您可以从不同领域的数据挑战中找到适合自己的解决方案,并真正理解数据缓存加速层的原理。
个人简介:范斌是位于硅谷的开源数据平台软件 Alluxio 公司的创始成员和 VP of Open Source。加入 Alluxio 前,范斌在 Google 从事下一代大规模分布式存储系统的研究与开发。范斌博士毕业于卡内基梅隆大学计算机系,博士期间在分布式系统算法和系统实现等方向发表多篇包括SIGCOMM,SOSP,NSDI 等顶级国际会议论文以及多篇专利。
议题介绍:随着电信业务的蓬勃发展,运营商持续改进数据分析架构来应对持续上涨的业务需求。本次分享介绍了联通核心业务如何基于Alluxio构建数据分析平台,在不同时期通过缓存加速与数据编排能力,应对系统扩展性提升、系统性能优化、复杂环境整合、与多场景融合等领域的挑战。
个人简介:张策,毕业于北京交通大学,2018年加入联通软件研究院,主要负责大数据平台的建设与维护。在Alluxio社区担任PMC Member
议题介绍:简要介绍网易大数据平台在特定场景下的需求痛点,分享网易大数据团队目前对于Alluxio的使用场景,以及网易大数据团队对Alluxio作出的优化和未来计划
个人简介:2020年加入网易工作至今,主要负责分布式数据编排系统Alluxio和分布式查询引擎Impala的开发工作。
丁天宝,多年大数据经验,涉及存储,引擎,调度,大数据开发等等。也有丰富的后端开发经验。前端也能做一点。
孙颢宁,曾就职于奇安信集团(原360企业安全),负责HBase的研发与维护工作;目前就职于Shopee,负责Alluxio的研发工作。
4. 倪子凡/黎磊 bilibili 资深开发工程师/云原生机器学习平台负责人
倪子凡,毕业于复旦大学。之前在微软Azure storage从事索引服务,目前在bilibili机器学习平台负责数据加速相关的工作。
黎磊,目前就职于哔哩哔哩云原生基础平台,负责机器学习平台;平台服务于公司内部广告、CV、NLP、Speech、电商等多个业务;曾就职于微软Azure、网易等公司。
议题介绍:本次分享会从介绍Alluxio架构和元数据格式出发,介绍Alluxio如何通过和底层存储之间的元数据同步对上层应用提供统一的数据视图,以及元数据同步的不同方式。同时在此基础上深入介绍Alluxio元数据同步的设计和实现原理。最后介绍Alluxio元数据同步功能的演进历史并针对不同用户场景给出调优最佳实践。
个人简介:刘嘉承,硕士毕业于哥伦比亚大学,目前就职于Alluxio公司研发团队核心组。发布了Alluxio K8s Helm Chart。参与并主导了一些Alluxio的RPC和内核优化工作。