2023開放原子開發者大會
AI時代數據庫存儲管理新挑戰分論壇 2023.12.16
隨著AI大模型的廣泛應用和普及,其模型訓練和推理的精準度對數據和信息的存儲、檢索、處理提出了更高的要求。為此,存算分離、向量化數據庫、圖數據庫、分佈式數據庫和開源數據庫等受到了前所未有的關注。12月16-17日,2023開放原子開發者大會(OADC)即將召開,“AI時代數據庫存儲管理新挑戰”分論壇將聚集國內頂尖的數據庫技術團隊,為開發者們提供AI時代數據庫技術的最新進展和實踐經驗分享。
AI 時代數據存儲管理新挑戰分論壇將於12月16日下午舉行。接下來,我們精選一些議題介紹,以饗讀者。
時序數據庫CeresDB技術揭秘
演講嘉賓:
曹瑞秋,螞蟻集團開發工程師,CeresDB 核心開發者,長期專注於時序數據庫領域,熱愛數據庫、開源。畢業自華南理工大學,畢業後即加入 CeresDB 項目組,深度參與過 CeresDB 多個模塊的研發與性能優化工作。
議題簡介:
作為一種新型的時序數據庫,CeresDB 的設計目標是高基數時序場景處理能力以及原生分佈式能力。會上將分享CeresDB 的一些核心技術細節,例如存儲格式(與經典時序數據庫的存儲格式對比);分佈式集群方案,包括數據分片和負載均衡策略;查詢路徑優化,包括分佈式查詢、查詢友好的 memtable、數據拉取和緩存等,以及 CeresDB 在螞蟻集團生産場景中的應用及其效果。
數據庫增強計算引擎
數據庫架構革新新思路
演講嘉賓:
張亮,SphereEX創始人,數據庫領域知名實踐者,擁有超過 10 年的數據庫領域探索、實踐經驗,熱愛開源,擅長分佈式架構,推崇優雅代碼。曾在多個大型互聯網集團公司任職架構、數據庫團隊負責人。Apache Member 、微軟 MVP 、阿裏雲 MVP、騰訊雲 TVP、華為雲 MVP、Apache ShardingSphere 創始人 & PMC Chair。是《未來架構——從服務化到雲原生》《A Definitive Guide to Apache ShardingSphere》書籍作者,在 ICDE 發表論文《Apache ShardingSphere:A Holistic and Pluggable Platform for Data Sharding》。
議題簡介:
了解數據庫增強引擎的創新理念和技術特點,打破傳統數據庫的限制。源於數據庫頂級會議ICDE的論文,深度解析新一代數據庫架構增強引擎的設計理念、技術特點和應用場景。
TiDB Serverless:
構建一個雲原生的Serverless數據庫
演講嘉賓:
張翔,PingCAP/TiDB Serverless 生態負責人,Python 核心開發者。
議題簡介:
如何將一個分佈式數據庫改造成一個 cloud native 的 serverless 數據庫,從而給客戶提供更好的服務和更低的價格,服務 modern development。新的架構帶來新的使用場景,cloud native 的架構使得 TiDB Serverless 可以推出 database branching 這種功能,提升用戶的效率和協作體驗,將數據庫融入到 CICD。
DingoDB:融合SQL與向量
構建功能完整的RAG數據庫底座
演講嘉賓:
孟聖智,九章雲極DataCanvas資深架構師,DingoDB多模向量數據庫主要設計者和開發者之一,擁有多年社區開源項目開發經驗,在分佈式數據庫、Serverless計算、虛擬化和容器平臺、高併發系統設計方面有較深入的研究,對分佈式存儲系統和分佈式數據庫方向有獨到的理解。
議題簡介:
介紹支持融合SQL與向量檢索多模向量數據庫的技術架構;融合SQL支持與Vector First-Class Citizen的支持,提供豐富的API訪問方式;基於Multi-Raft實現向量索引的實時構建與優化。
雲原生批流融合數據平臺
助力AI/LLM的實時數據處理
演講嘉賓:
翟佳,StreamNative 聯合創始人, Apache Pulsar PMC 成員和 Apache Member。主要從事分佈式、文件系統、流存儲相關的設計和開發。近年一直從事開源項目Apache BookKeeper和Apache Pulsar的設計開發和社區運營工作。他在分佈式、存儲、消息等領域有豐富的積累和經驗,在工作過程中,在相關領域先後獲得中美專利10余項。
議題簡介:
1、了解 LLMs 對實時數據的需求;2、 介紹 Event/Streaming 系統怎樣配合 LLMs 提供更高效的服務;3, 介紹 Apache Pulsar 及其在 LLMs 數據流轉中優勢。
騰訊雲TDSQL平滑去O的機遇挑戰
與開源實踐
演講嘉賓:
耿航,目前擔任騰訊開源專家,同時兼任木蘭開源社區運營負責人,中國科協“科創中國”開源技術傳播工委會秘書長,中國計算機學會開源發展委員會首批執委,NextArch基金會技術監督委員會成員、SODA基金會外聯委員會成員、Ceph基金會全球大使、中國開源雲聯盟副秘書長。
議題簡介:
分享騰訊雲分佈式數據庫TDSQL PG是騰訊內部深度實踐的分佈式數據庫,歷經金融、遊戲、廣告、社交等業務打磨10年之久,逐步推廣到千行百業落地應用。TDSQL團隊十年磨一劍,當前在面對數據庫升級和替換過程中的機遇和挑戰,將會和業界一起打磨共創商業數據庫語法兼容生態和開源生態,更好的助力企業數字化轉型,應對海量數據的高性能和高可用的挑戰,以及降低用戶的使用門檻,本次將為大家分享騰訊雲TDSQL平滑去O的實踐與開源實踐。
openGauss內核架構雙引擎
驅動大規模數據處理
演講嘉賓:
胡正超,華為openGauss內核技術專家,就職于華為技術有限公司,參與openGauss內核技術研發與探索相關工作,負責SQL引擎、DFX能力、性能優化方面的研發工作。目前openGauss SIG SQL/OPS Committer。
議題簡介:
介紹在高性能、高可用、高智慧、高安全上的創新特性。DataPod三層資源池化架構技術,DataKit數據庫全生命週期管理工具。
即刻報名,了解更多數據庫技術進展。
搜索“開放原子開源基金會”官網,或進入“開放原子開源基金會”公眾號,了解更多大會詳情。