0

0

Tobiko Data:通过 SQLMesh 彻底改变数据转换

betcha

betcha

发布时间:2024-06-19 14:24:02

|

1208人浏览过

|

来源于DZone

原创

Tobiko Data是一家由 Netflix、Apple、Airbnb 和 Google 的行业资深人士创立的创新公司,它正在通过其旗舰产品SQLMesh彻底改变数据转换格局。作为一个开源数据转换平台,SQLMesh 使数据科学家和分析师能够构建正确而高效的管道,解决当前数据生态系统面临的常见痛点。

Tobiko Data:通过 SQLMesh 彻底改变数据转换

SQLMesh 的强大功能

Tobiko Data是一家由 Netflix、Apple、Airbnb 和 Google 的行业资深人士创立的创新公司,它正在通过其旗舰产品SQLMesh彻底改变数据转换格局。作为一个开源数据转换平台,SQLMesh 使数据科学家和分析师能够构建正确而高效的管道,解决当前数据生态系统面临的常见痛点。

Tobiko Data 联合创始人兼首席技术官Tobias Mao在第 56 届IT Press Tour上解释道:“Tobiko Data 是一个开源数据转换平台。我们主要编写开源软件,我们的旗舰产品名为 SQLMesh。SQLMesh 是一个框架,它允许数据科学家和数据分析师以高效且可重复的方式处理数据,从而降低成本并提高生产力。”

解决痛点

当前数据环境面临诸多挑战,包括难以维护的意大利面条式代码、数据准确性问题以及导致成本飙升的低效率。Tobias 强调了这些痛点:“你不知道数据内部和外部发生了什么。数据的制衡机制非常不成熟。这导致了很多问题,以及数据准确性和数据中断方面的信任问题。就缺陷而言,整个行业都不愿意考虑这个问题。而且,到目前为止,确实有办法解决这些不协调之处”

SQLMesh 通过提供高效、正确且操作完整的解决方案来解决这些问题。通过利用虚拟数据环境、一次构建表并降低仓库成本,SQLMesh 为组织节省了时间和金钱。它的语义理解、列级 DAG 解析以及对任何方言的简单 SQL 的支持可确保正确性,而不会影响功能。

SQLMesh 的优势

SQLMesh 的一个关键区别在于其虚拟数据环境。Tobias 解释道:“SQLMesh 的工作方式是,假设您有两个数据模型,并且有一个非常简单的插件。SQLMesh 将有两层。一层是物理层。这是存储所有实际表的地方,然后是虚拟层,您实际上可以与数据进行交互。虚拟层只是指向物理层的视图。”

这种创新方法可以实现即时、无停机部署和轻松回滚,使 SQLMesh 成为第一个提供真正带数据的蓝绿部署的数据平台。Tobias 强调说:“这是 SQL 版本独有的,任何数据平台第一次能够获得真正的带数据的蓝绿部署。”

利用 SQLGlot 实现无与伦比的理解

SQLMesh 功能的核心是 SQLGlot,这是 Tobias 在 Netflix 任职期间构建的开源 SQL 解析器。SQLGlot 使 SQLMesh 能够理解各种 SQL 方言,这是实现正确性和效率的关键方面。

Tobias 解释道:“在我创建 SQLGlot 之前,这种能力并不存在。现在有 Snowflake、BigQuery、Databricks、Postgres 和 MySQL。它们彼此之间有很大的不同。这使得工具很难理解为一个数据库编写的 SQL 查询并在另一个数据库上运行它们。谁能理解所有这些不同的 SQL 指南?答案就是 SQLGlot。”

无缝集成和供应商独立性

SQLMesh 可与现有数据生态系统无缝集成,包括 Snowflake 和 Databricks 等热门平台。它能够将代码从一种方言转换为另一种方言,从而确保供应商独立性,使组织能够拥有自己的数据并避免供应商锁定。

AI智研社
AI智研社

AI智研社是一个专注于人工智能领域的综合性平台

下载

Tobias 强调说:“将 SQLMesh 与 Apache Iceberg 这样的数据湖结合使用,确实可以让您真正具备在任何供应商平台上工作的能力。”

数据转换的未来

Tobiko Data 的 SQLMesh 有望塑造数据转换的未来。凭借其高效、正确且操作完整的方法,SQLMesh 解决了数据科学家和分析师面临的关键挑战。随着组织越来越依赖数据驱动的决策,SQLMesh 等工具在构建可扩展且可靠的数据管道方面变得不可或缺。

Tobias 完美地总结道:“SQLMesh 是生成可扩展且正确数据的首要平台之一。这个平台可以帮助您的数据团队构建这些 AI 模型。”

拥抱开源社区

Tobiko Data 对开源软件的承诺在其构建和维护 SQLMesh 的方法中得到了体现。通过培育蓬勃发展的社区并利用协作的力量,Tobiko Data 确保 SQLMesh 始终处于数据转换创新的前沿。

Tobias 强调了开源社区的重要性:“我们的 Slack 频道拥有超过 2,000 人的庞大且不断增长的社区。当我们首次推出时,人们的反应是,‘哇,这解决了我们多年来遇到的很多问题。我们只是没想到能解决这些问题。’”

前方的路

随着 Tobiko Data 不断创新和扩展,SQLMesh 及其采用者的前景一片光明。SQLMesh 高度重视效率、正确性和操作完整性,完全有能力彻底改变数据转换格局。

托拜厄斯总结道:“现在,我玩得很开心。我做这件事不是为了任何经济利益。我只是想创办一家公司,和朋友们一起工作,创造一些伟大的东西。所以我们会看看这会给我们带来什么。”

对于寻求强大且用户友好的数据转换解决方案的开发人员、工程师和架构师来说,Tobiko Data 的 SQLMesh 是一个改变游戏规则的解决方案。通过利用 SQLGlot 的强大功能、虚拟数据环境以及对开源创新的坚定承诺,SQLMesh 将重新定义组织处理数据转换的方式。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

749

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

328

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

350

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1283

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

361

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

861

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

581

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

423

2024.04.29

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.1万人学习

Django 教程
Django 教程

共28课时 | 3.7万人学习

Excel 教程
Excel 教程

共162课时 | 14.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号