36Kr了解到,以流数据为核心的实时数据分析基础平台“Timeplus”已于日前完成种子轮融资。本轮融资由高瓴创投领投。其他联合投资者和专家顾问包括杰里米克兰兹;GICMT投资总监;苹果前高级副总裁罗里塞克斯顿(Rory Sexton),过去20年一直负责打造苹果的全球供应链能力;理查德蒂贝茨(Richard Tibbetts),实时流数据库专家,现任Tableau产品副总裁;BMC高级副总裁、数字服务与运营管理总经理、Splunk前副总裁玛格丽特李。
Timeplus成立于2021年11月底。它是新一代面向流数据的数据基础平台,专注于实时流数据分析。
科普一下,目前的大数据分析系统大致可以分为批量大数据和流式大数据。其中,批量大数据也叫历史大数据,流大数据也叫实时大数据。不同类型数据的处理时间不同。据资料显示,目前复杂的批量数据处理通常跨度从几十分钟到几个小时不等。基于历史数据的交互式查询,通常时间跨度在几十秒到几分钟之间;基于实时数据流的流数据处理通常需要数百毫秒到数秒。
时光创始人王婷向36Kr介绍,从行业趋势来看,以物联网/机器行为、应用行为、交互行为等为代表的实时数据。目前增长最快,预计2025年将超过30%。Gartner还预测,超过50%的企业应用需要实时数据分析能力,以提高企业的运营效率。同时,数据整体实际利用率不到5%,实时数据利用率更低,可挖掘的潜力和场景更大。IDC还预测,“企业正在寻找能够完全满足和拥抱这些实时数据的新一代数据基础设施”。就实际业务功能而言,能够满足实时数据利用需求的大数据基础设施,可以对内提高企业的运营效率,对外更好地了解客户、服务客户,从而生产出满足客户需求的高质量产品。
例如,王婷介绍,流大数据基础设施可以帮助企业在实时供应链可视化和物流监控、智能制造、实时财务欺诈、实时营销和个性化推荐、智能汽车实时监控等方面更好地利用流数据。比如智能汽车的实时监控场景,一辆智能汽车一天产生的实时数据可能超过10TB。
因此,对这些庞大的实时流数据、用户的驾驶和交互行为进行实时分析和监控,可以保证汽车的驾驶安全,提高用户体验。进一步说明逻辑。在智能电动汽车的电池监控场景中,一方面需要根据实时电池传感器流量数据中的一些指标快速统计出3354。例如,在最后一个小时内电压低于11V的次数被用作触发实时警告的初步异常信号。同时还需要与历史数据(像天气、时间段、路况等电池异常数据)进行对比,进一步明确或消除一些分析数据过短导致的误报和细节。
根据王婷的观察,传统的数据处理产品解决方案在性能、延迟、灵活部署等方面很难有效支撑这些需求。这只是一个例子。同样的需求也发生在金融、供应链、营销等场景中。总之,随着数据量的爆炸式发展,个性化服务、提升用户体验、智能分析、过程决策等复杂实时的业务需求对大数据处理技术提出了更高的要求,这也是流媒体数据基础设施进一步发展的必然。
相对于现有的产品,王婷认为,目前大多数集中统一的数据仓库和分析平台都是面向全量的历史数据的。由于大规模、全量的数据处理,整体处理需求耗时太长,数据新鲜度往往无法满足用户的时效性要求。因此,基于时间的数据实时分析和响应的实时智能化和自动化将成为新的行业趋势。
针对这些痛点,Timeplus欲打造新一代时序流数据实时分析平台3354,即一款既能高效低延迟聚合实时流数据和历史数据,又能提供高级分析场景的产品。至于企业客户对业务的价值,希望能够帮助开发全新的实时数据分析和实时运营自动化场景,体现实时数据驱动业务的价值。
从整体效果来看,判断实时流数据分析平台性能的一个核心指标是实时事件数据的处理分析延迟和吞吐量。
在目前的测试环境下,Timeplus实时复分析的端到端延迟在普通机器上小于100ms甚至小于10ms,性能超过行业水平20倍以上。同时,实时事件分析的吞吐量可以超过每秒1000万个事件。而且Timeplus整体部署成本低,可以从云端灵活部署到末端,甚至部署到设备端。“在完成强大复杂的分析功能和卓越性能的同时,数据计算和存储的消耗远低于当前行业解决方案。”王婷说。
之所以能达到这样的效果,与Timeplus基于流优先级的实时数据分析架构的设计和向量化分析的集成密切相关。从底层技术架构上拆解,Timeplus设计了以时间为核心的统一实时分析引擎,支持多层计算模型,兼顾流式和历史分析。该引擎旨在使实时数据收集、实时处理和实时洞察生成的整个过程变得简单而快速。
首先在速度方面,王婷告诉36Kr,Timepl
us的引擎可以对实时数据做到快速的存储,并反哺其整体分析速度。比如,在让实时数据导入到其流式分析平台的过程中,相较同业其引擎能提升40倍的导入速度。另外,这一引擎能同时处理实时数据和历史数据,使得最新的数据和历史数据联查变得可能而高效,且不需要大量预计算和重复计算。由此可见,这一引擎的作用首先是导入的高效,另外其在处理上也使得整体的分析速度更高。引擎也是公司的核心壁垒之一,在底层支持着整体数据的分析加速。
而且,Timeplus还可以按照特定格式对数据进行存储,这会让数据存储变得一致和高效。在更为具体的效果上,王亭介绍:"时间高度优化的新一代数据存储和分析格式 TDF(Timeplus Data Format),会让数据无论在内存、磁盘还是云存储下,无论是流式分析还是历史分析查询中,都能高度保持一致和高效。不但数据只存一份,而且还能做到超高存储和检索能力,高可用,无数据丢失,同时支持向量化分析 。" 这不但可以大幅降低服务器存储成本,而且让亚秒的实时分析变得可能。
同时,在易用性方面,Timeplus选择SQL作为统一分析查询语言,这会让绝大多数企业客户无需学习和使用新语言,无需编码就可以快速接入数据进行分析探索,获取实时洞察。当然,使用SQL这类标准语言,也会让Timeplus在汇聚不同数据库的数据时更加快速便捷。
另外王亭还强调,Timeplus的特点也并不仅在于速度。其认为,Timeplus作为实时数据基础设施平台的最大价值在于,真正把数据转换成企业的实时决策和实时自动化,促进业务的巨大增长,提升企业竞争力。在具体场景上,Timeplus可以通过自身产品帮助用户进行时间旅行——即用户可以自由查询几个小时前的统计分析情况等。也就是说,这类产品并非空有技术而无场景。针对流式数据的大数据处理、分析平台首先要能满足客户的业务需求,促进相应场景中业务的发展,在此基础上尽可能提升产品性能。
据介绍,Timeplus目前已经正式发布Beta版本的产品,吸引了一些全球客户和合作伙伴的参与,如AlphaStream,Aurora耀乘、datapm、gravitydata等。以AlphaStream为例,作为一家巴西金融科技公司,他们使用Timeplus做到了实时股票市场定价。Alpha Stream的执行董事表示:“我们能够简单地将源插入 Timeplus 并开始对流数据编写热查询以获得结果。无需编译和部署代码。我们还可以将结果引导到接收器以在仪表板中使用,甚至可以组合到另一个分析中。这使得原型设计能够非常快速地部署应用程序。”
产品之外,王亭也介绍了公司的整体特点。具体而言,Timeplus团队具备国际化基因,同时积累了较深行业产品和技术经验。其创始团队来自Splunk、SAP和Amazon等业界头部数据平台公司。团队之间的合作时长达到10年。
其中,CEO王亭为Splunk前全球工程副总裁,2012年作为创始人,筹建和发展Splunk第一个海外研发中心,带领上百人团队。早前,其曾在SAP BusinessObjects担任产品工程全球副总裁,负责全球头部的BI平台主打产品线Crystal Reports和Dashboards的产品和研发,同时主导SAP新一代分析可视化平台软件,成为SAP Lumira Cloud的核心部分。另外,王亭也曾在TalkingData担任CTO。公司COO彭伟(William Plummer)毕业哈佛大学商学院,具备20多年在高盛等世界顶级战略咨询公司经验,曾任TalkingData首席战略官,负责公司的战略规划, 管理海外业务线以及KA客户、渠道合作。公司CTO陶刚具备20多年企业软件设计经验,曾担任华为加拿大Distinguished Engineer and Architect。其也是前Splunk总部AI/ML以及数据生态平台部门首席工程师和前SAP商务智能可视化首席架构师。
也因为这些背景和经验,王亭表示,公司接下来的一段时间内会先关注欧美等全球市场。同样由于公司团队在海外多年的积累,目前其已经有金融、供应链、工业互联网以及互联网行业的客户线索。另外,公司也在中国区设有研发团队,正在招募新成员加入Timeplus,也和合作伙伴一起在时机成熟时进行商机探索。
在不久之后,Timeplus也将发布正式的产品,以期触达、服务更多客户。
高瓴创投合伙人李强表示:全球数据增长进入持续爆发阶段,未来3年的增长总量将是过去30年的总和,其中又以流数据占比最高——达到了增长中的30%以上,而现有基础设施难以应对这一数据快速增长下的需求。Timeplus创始团队拥有超过15年的软件行业实战背景,基于多年工程实践和技术创新、打造出的云原生流数据分析平台,能够帮助企业实现更高的业务敏捷性。我们看好Timeplus有机会成为新一代数据分析基础设施,这也是我们为何从种子轮开始支持Timeplus的原因。相信在创始人王亭带领下,Timeplus将以顶尖技术、为更多行业和企业提供持续创新的数据服务能力。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。