大模型的号角已在数据剖析商场吹响|下篇

09-04 149阅读 0评论

接上回,复旦大学大数据学院与高档学术研究院副院长、上海市数据科学要点实验室副主任阳德青,上海市大数据股份有限公司高档产品司理、DAMA我国认证首席数据官汪科科,以及来自观远数据、Datafocus、北极九章、思迈特Smartbi的讲演嘉宾别离结合自己的职业经历为咱们共享了大模型在数据办理与数据剖析职业的落地场景。

下半场,咱们邀请到天津海量信息副总裁杨智炜、澜码科技开创人兼CEO周健、数势科技CTO韩秀锋、北极九章合伙人兼首席布道师沙海洲以及DataFocus开创人兼产品司理王碧水同台沟通。当AI遇见BI,二者将怎样对话?以下是

圆桌摘抄,内容较长,主张保藏:

01 八仙过海,各显神通

杨巍:今日现场树立最早的公司是天津海量信息,是一家处理非结构化数据发家的公司,请问你们是从什么时分、因什么机缘进入数据中台以及结构化数据的商场?

 大模型的号角已在数据剖析商场吹响|下篇

▲ 杨 巍

杨智炜:天津海量树立得比较早,1999年就树立了,和百度算是同期。咱们其时也做搜索引擎,不过是为企业级客户做,中心技能是中文分词。该技能服务过腾讯、阿里以及海外等多家企业。后来环绕该技能衍生出许多服务运用,比方智能收集、智能审阅等服务,但咱们的技能底层一直环绕大数据板块。大数据渠道最早是团队在2005年前后开端树立,一直到今日现已迭代到第五代。伴跟着AI技能的呈现,咱们也试着将AI结合咱们本身的大数据架构层层嵌入,来支撑咱们一直在做的作业,可以更智能化地为客户服务。

 大模型的号角已在数据剖析商场吹响|下篇

▲ 杨智炜

 杨巍:台上企业树立第二久的是DataFocus,树立于2014年。在你们公司网站上有一句话叫,太多的工程师、太多的企业日夜与数据库打交道,他们乃至忘了SQL是一种极端小众的言语。当下,大言语模型生成机器言语的才能应该说现已被证明了,请问王总您以为DataFocus的处理方案是暂时抢先的、大模型更新后或将很好地写出小众的机器言语,仍是说即便在现在大模型的架构下,在相对长的一段时刻里,你们都有不行代替的优势?

 王碧水:哈哈,这个问题十分直接,也感谢杨教师可以看到咱们很早之前写的这样一句话。咱们对大模型的才能也有第一时刻的感知,BERT、T5模型的时分就现已重视了。我觉得这么多年以来,错觉是大模型技能底子性的问题,是很难消除的。假定说它没有错觉,它或许也就没有立异才能了,就像是一体双面,你不能盼望它既有创造力,又什么错都不犯。全体来说,咱们可以等待下一代模型准确率会持续进步,错觉现象会削弱,但要想让它彻底根绝这个问题短期内是不行能的,所以现在来看咱们的道路仍然是未来比较靠谱的。

 大模型的号角已在数据剖析商场吹响|下篇

▲ 王碧水

杨巍:好的,谢谢。时刻来到2018年,北极九章树立了。北极九章最早树立的时分有一个标语,把增强型数据剖析最早带入我国。增强型剖析听起来也在讲AI和数据剖析的结合,所以我想讨教一下,增强型数据剖析和大模型驱动的数据剖析的底子差异在哪里?大模型技能的哪些部分或许是对之前增强型数据剖析的推翻,或是更好的技能完结?

沙海洲:2018年那会儿咱们都在卷灵敏BI、dashboard,咱们就现已想做这么一件作业,可是没有想好怎样界说。然后咱们在Gartner那儿遇到了“增强型剖析”这个概念,所以就借用它引进我国。其实增强是一个泛化的概念,咱们只是期望可以全体改动咱们现有的和数据交互的办法跟整个作业流。而咱们所做的增强型剖析也并不意味着和大模型数据剖析爱憎分明,咱们会把包含大模型在内的多种技能,依据它们合适的场景,作为产品的功能模块,迭代到产品上,从效果上客户获益是咱们的终极意图。

 大模型的号角已在数据剖析商场吹响|下篇

▲ 沙海洲

杨巍: Gartner对toB的信息服务职业的确有很大影响,这次有好几位参会的嘉宾网站上都直接引用了Gartner的某句话或某个概念。时刻再后移两年,数势科技树立了。数势科技的主要产品是方针体系,韩总能不能简略介绍一下方针体系和BI是什么联系、有什么差异?

韩秀锋:数势科技是2020年树立的,开创团队也都是百度和京东的布景。我个人是在2023年参加的,原先在百度做AI技能的场景落地,所以对AI技能产品化处理场景问题的范畴有比较多的经历。数势科技在做企业数字化转型的进程中发现企业数据价值化的关键在于要让数仓里边的结构化和非结构化数据实在服务好企业各个场景的实践。咱们的产品也环绕这个中心问题不断地聚集和收敛,终究选定了做企业数仓虚拟化的产品,在方才的技能曲线里边归于HeadlessBI(无头 BI)的技能途径。也便是说,经过技能化的思路,自下而上地把事务的场景化言语、范畴型言语与技能解耦,使得研制是研制,事务是事务。22年末、23年头,也被称为大模型元年,咱们看到了agent,看到了数据价值和大模型结合的时机,所以进一步让数据和价值普惠化,迭代了咱们的产品。

 大模型的号角已在数据剖析商场吹响|下篇

▲  韩秀锋

杨巍:好的谢谢。又过了三年,澜码就树立了,可以说是大模型原生的企业。澜码的标语是人人都能规划自己的AI Agent。今日除了周总之外,其他公司都是搞BI,那么请问Agent对BI终究有什么样的效果?

周健:在企业服务职业里,AI Agent其实最早不叫Agent。Gartner在2021年提出,企业事务未来将开展为Composable,即事务是可拆解的、可拼装的,并提出一个才能“packaged business capabilities”,即封装好的事务才能。换言之,咱们可以经过RPA调用不同的运用,可以经过数据库中获取数据,可以经过BI或许机器学习取得洞悉等等,这些才能拼装起来就能变成林林总总的Agent。Agent可以算是一个新年代的软件产品,但处理的并不是上一代体系与体系之间的衔接,而是赋能人和体系之间的衔接。在咱们做编列和自动化的进程中,很重要的一环便是对需求端的了解。咱们经常说只吃第三个包子饱不了,所以咱们为了吃第三个包子,仍是要把前面第一个或许是RAG,第二个或许是数据剖析,随后或许是和API相关的func call才能等等都吃到肚子里。到了现在这个阶段,咱们觉得Agent现已可以和其他传统PAAS包含BI厂商一同协作,一同服务用户,协助用户编列他们想要完结的使命,BI更侧重处理需求了解这一侧。

 大模型的号角已在数据剖析商场吹响|下篇

▲ 周健

02 大模型浪潮下的BI商场

杨巍:接下来我有几个问题与咱们一同评论,每个问题想请两位嘉宾来答复。首先想请北极九章和Datafocus的两位结合你们事务落地时分的实在状况与咱们共享一下,在大模型技能呈现前后,BI终究用户的人物和身份有没有改变?

王碧水:大模型出来之后,用户显着下沉,没有太多技能根底的人反而获益最大。原先他了解自己干不了这些事,之前的做法或许是直接找IT人员帮我,假如IT做不了,那我爽性就不干了,所以有许多需求还没有被释放出来。现在当团队引进这样的产品后,门槛下降,事务人员就有时机渐渐参加这件事。

杨巍:那请问沙总,您觉得依照Datafocus这位嘉宾的说法,数据剖析师这个职位会不会从体系中消失?

沙海洲:我觉得咱们在座各位的意图都不是要干掉现在的剖析师,国内最大的问题是我没有满足多的剖析师。数据剖析师的概念大约十年前才在我国鼓起,截止现在总数是远远不够的。当企业招不到满足的数据剖析从业者怎样办?咱们觉得可以经过东西来补偿,让一般的事务人员得到技能的赋能。

韩秀锋:我想弥补一个实践事例。咱们最近和国内餐饮top10的品牌书亦烧仙草协作,尽管他们论述数据的需求在整个场景里优先级是比较高的,但简直一切的店长和区域督导都不会运用传统BI东西,总部只能经过巡店去看各门店的运营数据。后来接入咱们的产品后,就很好地协助他们这部分的数据价值落地了。所以在数字智能年代,数据的消费商场必定是在不断扩大的。一起,数据剖析师、数据工程师等数据的出产者其实也需求不断把企业常识才能进一步加工,让企业常识和数字人或是Agent相结合,与其说是代替,不如说是数据职业人物作业的内容和办法在改变。

杨巍:谢谢弥补,刚好下一个问题我也是想讨教您和Datafocus。Datafocus说他们的方案可以极大地简化方针体系,我想听听您对此的点评。

韩秀锋:其实当下结合咱们对客户的服务实践来看,最具落地性的仍是方针渠道加ChatBI的方式。在数据消费环节,咱们经过ChatBI的办法把原先数据运用的门槛下降,一次性交互即可完结数据出产。一起咱们着重企业整个数据的模型构建与事务范畴常识全办理等等耦合在一同,构建进程与企业的复杂度、数据的量级都强相关,并且这个模型笼统化的质量也决议了后边它能不能迭代进化。由于数据办理或许数据堆集许多都是越治越乱,需求不断在新的渠道上迭代。当然,各有各的道路挑选,道路也和企业详细的方针客户和集体职业相关。

杨巍:那我想讨教王总,您觉得在数势科技描绘的数据十分复杂的状况下,你们的技能道路怎样简化他们的方针体系?

 王碧水:其实我全体比较拥护方才韩总的观念,Datafocus的产品意图也是从技能上简化方针体系的构建。当然,商场上有许多企业大多数人对数据的要求都不清晰,咱们懒得发问或许压根不知道该怎样发问,这都是十分实践的问题,只不过Datafocus不做个性化定制的事务。

 杨巍:我了解的王总的意思是方针体系既是一个实在的需求,也是一个很好的商业方式,我想接着讨教海量科技和北极九章有关商业方式的问题。我看了两位的官网,海量的网站上没有产品中心这个板块,只需运用中心,里边介绍了许多场景和才能;北极九章相反,只需产品中心和客户实践的产品运用事例。所以我想讨教二位,大模型驱动的BI在实践的商业方式中,产品化和定制化你们是怎样取舍的?

 杨智炜:我连续前面方针的论题来说,由于咱们现在许多数字化作业也是环绕企业的各项方针来实践,我以为方针大致可以分为几种类型,一种是方案性方针,这部分是环绕着PDCA模型,可以由企业依照方案整理出来的;第二种是突发性方针,这类方针环绕着OODA模型,该类模型方针更多的是应对突发事件,咱们作业的齐备性;再有一类方针可以被称为应战性方针,具有必定难度,需求检测团队的方针策略性。咱们的事务打开正是根据这个逻辑。跟着互联网的开展,其实面临应战的是后两者的方针,咱们需求打造的是产品个性化,输出即成果的服务。企业的中心不是产品形状的标准化,而是其方式的标准化,就像麦肯锡的办法论是其中心,运用该办法论可以为不同的企业进行多元化的咨询服务。

 杨巍:那请问北极九章现在有多大份额直接卖产品,有多少份额是做个性化的服务?

 沙海洲:咱们公司只做纯产品,咱们服务各个职业的大客户。咱们以为尽管职业之间有林林总总的差异,可是数据是可以极致笼统的,只需你的产品标准化程度满足高,你就可以协助客户处理他们的痛点。由于咱们调查发现客户越来越沉着,当需求用很高的本钱处理20个需求和用极低的本钱处理19个需求时,他们会挑选后者。当然,咱们也会和一些工业同伴协作,包含专门做数据中台、做方针渠道的企业,由他们来担任协助客户处理一些个性化定制的需求。

 杨巍:那请问北极九章怎样点评不做BI只做Agent的澜码科技?

 沙海洲:我觉得特别好。其实咱们也看到许多在百模大战中走出来的公司都在做一些商业化的活跃改变。咱们近期正在对接的某客户就提出过一个主意,说有没有或许帮他们树立一个AI中台,用大模型的才能协助他们在详细的事务场景下调用不同的小模型或运用,终究用大模型会集输出,这也是大模型技能落地的一种方式,其实很挨近Agent。咱们不主张只依靠某种特定的技能或许固定的一种产品。我个人也十分喜爱澜码这种走在技能前沿的公司,当然咱们自己也在尽力做走在技能前沿的公司。

 杨巍:最终一个讲话时机留给周总,澜码的BI要用他人的,你们预备怎样与他们竞赛呢?

 周健:为什么要和他们竞赛呢?我前几天和一家做方针的协作同伴谈天,对方忧虑说未来会不会不需求方针,不需求再做ETL数据仓库了,给出一句指令就一了百了了,但我个人以为这种状况不太会产生。咱们每个年代都有自己年代的IT根底设施,会有越来越多新颖的东西。就像开端数据库其实只是用于银行和运营商的中心体系,是十几年前谷歌带进来的技能,所谓的大数据,后来咱们才进一步开端剖析用户行为数据等等。那其实今日大言语模型带给咱们最重要的也是处理非结构化数据的才能,咱们的谈天记录、零星的文本都得以被使用起来。不管是SQL仍是Hadoop仍是林林总总的方针,BI是使用数据的办法,我信任这是不会被代替的,但未来必定会有越来越多层面的东西,人应该被解放去做这些立异的作业。举个最简略的比如,我现在总算有一个Agent可以去核算咱们公司的周报和出售的周报,可以使用大模型去了解周报并协助我进一步做数据剖析,最终给到我一些出售的头绪。咱们的核算会变得越来越廉价,越来越多的数据可以被使用起来,可以发挥越来越多的价值。人们应该去打黑神话悟空,而不是在Excel里边做算术盘数据,这是咱们的观念。

活动最终的 happy hour环节,叁伍拾科技,杭州量智数据科技,九地AI以及人社部AIGC教材副主编、导师卢山也别离向现场观众介绍了自己在数据智能范畴的实践和洞悉,创业者和技能爱好者也在此环节打开了充沛沟通与展现。

 大模型的号角已在数据剖析商场吹响|下篇 大模型的号角已在数据剖析商场吹响|下篇 大模型的号角已在数据剖析商场吹响|下篇 大模型的号角已在数据剖析商场吹响|下篇 大模型的号角已在数据剖析商场吹响|下篇 大模型的号角已在数据剖析商场吹响|下篇 大模型的号角已在数据剖析商场吹响|下篇

本次沙龙由启迪之星(上海)、小便是大立异同伴联合CCF(上海)我国核算机学会主办,由上海市女企业家协会科创专委会、上海数据集团、SMG团委一同协办,并得到来自亚马逊云科技云创方案、欧美同学会上海AI分会、S创Slush、复旦mba读书会、钛媒体、亿启云巢、SMG AI研习社、北大青年CEO沙龙、LSE校友沙龙、大连理工创业校友会、Datawhale、Llama中文社区上海站、五角场高新园、长阳创谷 、segmentfault 、上海AI爱好者沙龙 、橘子联盟的大力支持。

发表评论

快捷回复: 表情:
评论列表 (暂无评论,149人围观)

还没有评论,来说两句吧...

目录[+]