非常想知道,奇妙逻辑冒险下载AI助手的盈利逻辑是什么?


来源:深燃,作者:黎明,编辑:魏佳
图片来源:由无界 AI工具生成
今年大火的AI大模型,正在加速制造独角兽。
5月30日,人工智能公司出门问问披露招股书,拟在港交所上市。这是大模型热潮以来,中国第一家打着通用人工智能旗号冲刺IPO的公司。
出门问问成立于2012年,是人工智能赛道里的资深玩家。创始人李志飞是前Google科学家、资深自然语言科学家,出门问问的创业方向一开始定位在语音交互。
过去十多年里,这家以技术见长的AI公司,一直在寻找商业化的落地场景。从语音交互解决方案,到各种智能硬件,再到百花齐放的AIGC工具,现在,它想借着大模型的东风,尽快登陆资本市场,抢夺AIGC第一股。
出门问问号称自己是“亚洲为数不多的具有建立通用大模型能力的AI公司之一”。它在2020年开发出通用大模型UCLAI,今年升级为“序列猴子”,精准踩上了大模型热点。
2022年,出门问问收入5亿元,其中AIGC解决方案收入3986万元。凭借不到4000万元的AIGC业务收入,就让出门问问成为了“中国营收最高的专注于AIGC技术的AI公司”。
一名业内人士评价,这种“矮子里拔将军”现象的诞生,是因为AIGC是一个新兴赛道,这个赛道里的公司,大部分都不赚钱。而在招股书中,给公司之前加上各种定语,再加上“第一”“最”等头衔,属于常规操作。
给自己贴上“通用人工智能”标签的出门问问,成色几何?
做什么的?
出门问问是一家人工智能公司,在介绍它的业务之前,我们先说说它踩上的两个风口。
一是通用人工智能。所谓“通用”,指的是可以在多种场景和任务中表现出智能,而不只是针对特定场景。今年这波AI热,最大的关键词是“通用”,它被视为行业拐点到来的象征。
二是AIGC。AIGC是一种内容生产方式,在它之前分别是PGC(专业生成内容)、UGC(用户生成內容)。AIGC的内容由AI生成,被认为是内容生产方式的大变革。
上述业内人士称,出门问问过去做的业务,其实跟以上两个概念并无直接关联。但因为创始人李志飞的研究领域就是自然语言处理,而OpenAI的大模型就是从这块突破,且在技术上有很多共通之处,出门问问被推到了风口。
按照出门问问最新的介绍,公司的商业模型由三层架构组成。
基本的逻辑是:研发以通用人工智能为核心的底层技术,然后基于这个技术底座推出各种解决方案,比如AIGC,最后找到具体的场景进行商业化落地。
先看底层技术。出门问问最早是从语音搜索引擎切入,优势在语音识别技术。基于此,它开发了ASR(自动语音识别)、TTS(文字转语音)及NLP(自然自然语言处理)等技术,构成AI CoPilot的雏形。
直到2020年,出门问问才开发出通用大模型UCLAI,然后在今年借着热点升级为“序列猴子”。它的系列产品就架构在这套模型上。
这些技术最终需要具体的产品落地,于是出门问问基于底层技术推出了三大解决方案——AIoT、AIGC、企业服务,对应着三大目标客户——C端消费者、创作者、企业。
AIoT的产品主要是一些可穿戴设备、智能家居,主打产品是AI智能手表。
2015年出门问问推出首款智能手表TicWatch 1,至今已经迭代至第五代。根据招股书的披露,TicWatch系列已销往100多个国家及地区,自2020年以来累计销售100多万件。除了智能手表,出门问问还推出过无线智能耳机、智能后视镜、智能音箱等产品。
AIGC解决方案的服务对象是内容创作者,比如有人剪视频、做直播、在社交媒体发帖等,可以借助一些AI工具提高效率。
出门问问在这块的产品包括:AI配音助手“魔音工坊”及其海外版“DupDub”,主要是用AI给短视频创作者配音;AI写作助手“魔撰写作”,一开始的功能是帮助给文章纠错、校对、润色,后来可以自动生成文章;AI数字人“奇妙元”,去年3月推出,可以克隆真人的形象、声音,生成数字人进行直播。
企业解决方案有两大块,一是AI语音交互,二是智能客服。比如给汽车厂商提供车载语音交互系统,给保险公司提供AI客服。出门问问称,自2020年以来,预装其车载语音交互解决方案的汽车超过200万辆。
整体来看,出门问问在本质上是一家技术开发公司。它面临的考验一是技术是否领先,二是能否找到好的落地场景。
现在,出门问问冲刺IPO,宣称自己是一家通用人工智能技术公司,对外界传递着信息:自己掌握的技术具有通用性,因而应用场景广阔。
只是,事实真的如此吗?
怎么赚钱?
故事讲得再美好,终究要靠数据说话。
在招股书中,出门问问多次提到通用人工智能、AIGC,但这些概念在当前并未带来很多收入。
从营收构成来看,2022年之前,公司最主要的收入来源是AIoT解决方案。2020年、2021年,AIoT贡献了2.2亿元、3.4亿元收入,在总收入中的占比分别为83%、85%。你可以简单理解为,这是一家卖智能设备(尤其是智能手表)的公司。
不过,出门问问不只是卖硬件,它最终的目的是通过硬件卖软件。基于语音交互技术,出门问问开发了元创秀、小问睡眠、小问健康、小问运动等应用。你可能会经常在它的产品中看到“小问”个人虚拟助理。
这是出门问问硬件产品的一大卖点,也扩大了收入来源。
我们在前文提到的AIGC和企业业务,构成了出门问问的另一大收入板块——AI软件解决方案。2022年,这部分收入首次超过AIoT,占比提升至60.6%。其中,尤以企业业务收入增长迅猛。
2020年,出门问问的AI企业解决方案收入只有4478万元,2021年也只有5270万元,2022年大增至2.63亿元,主要是汽车客户贡献。
这块业务明显比AIoT赚钱。它带动出门问问的毛利率,从2020年、2021年的30%、37.5%,增至2022年的67.2%。
AIoT和企业业务,是目前出门问问的支柱业务。但在招股书中,出门问问更想突出的,是收入占比不大、看起来有前景的AIGC解决方案。
去年下半年开始,AI作画、AI写诗、AI作文等AIGC应用得到业内追捧,虽然商业化前景还不是特别明朗,但科技巨头争相布局。
出门问问最大的优势是布局早。2020年,AIGC就已经为出门问问贡献收入,虽然只有49.6万元,但至少证明有商业空间。2021年,AIGC收入增至682万元,2022年进一步增至3986万元。由此可以看到,2022年是AIGC的爆发之年。
不过,现在AIGC在出门问问的总收入中,占比只有8%,还不成气候。
外界看好的是AIGC大爆发带来的增长前景。根据灼识咨询的测算,2022年中国AIGC市场规模为4亿元。如此计算,出门问问在2022年占据10%的市场份额。灼识咨询预计,中国AIGC市场2027年将达到326亿元,复合年增长率为136.3%。
如果出门问问能稳住当前的市场份额,那也是一块相当诱人的蛋糕。
至于业内真正关心的通用大模型,出门问问现在还在讲故事阶段。
出门问问在升级“序列猴子”后,开发了两个AIGC解決方案流水线——AI绘画助手言之书、AI写作助手奇妙文。前者能实现文字、图片互转,后者能进行内容创作。不过,这两大流水线仍处于测试阶段,尚未产生任何收入。
有何风险?
跟大部分AI公司不同,出门问问没有动辄十几亿的财务亏损。它在2020年是盈利的,2021年和2022年分别亏损2.76亿元、6.7亿元。如果排除优先股账面价值变动等干扰因素,得到经调整净利润,它在2022年还盈利1.09亿元。
然而,这并不意味着出门问问财务稳健。
出门问问的规模还太小。5亿元的年收入,相比很多科技公司堪称九牛一毛。另外,它的现金储备不是很宽裕。
2020年、2021年、2022年底,出门问问公司账上的现金及现金等价物余额,分别为2.15亿元、1.32亿元、4025万元。即便再算上定期存款,出门问问在2022年底的资金也只有1.1亿元。
拿这样的家底进军AI大模型,跟谷歌、OpenAI、百度等巨头竞争,实在是没有底气。
更大的风险在于,出门问问的商业化能力是否具备可持续性。
表面看,2022年出门问问的公司营收增长了26%,增速尚可。拆开来看,就会发现这其中有问题——客户过于集中。
2021年出门问问跟一家汽车厂商达成了合作,以分享知识产权的方式获取收入,主要涉及的是语音对话系统的后端技术开发。仅这一个客户,在2022年为出门问问贡献了2.13亿元收入,占其年营收的42.6%。
单一客户营收占比过大,是一个很大的风险。
而从2020年至今,最大客户的收入占出门问问总收入的比例,从8.8%到24.1%,再到42.6%;前五大客户的收入占比则分别为22.4%、37.0%及62.8%。
有投资人质疑,这家公司拓展新客户、维持收入稳定增长的确定性有多大。
早年刚创业时,李志飞的前东家谷歌,曾对出门问问支持很大。不仅真金白银投资,还给了出门问问很多业务。根据出门问问招股书,谷歌持有其13.26%股份,另外,大众汽车集团也是股东。
梳理出门问问过去三年的前五大客户名单,我们会发现,大部分还是AIoT解决方案的客户。但这块业务在出门问问的重要性正在下降,收入占比在降低,且毛利率下滑(由2020年的30.2%降至2022年的26.4%)。
旧的增长引擎开始乏力,新的增长引擎尚未建成,出门问问面临的转型压力不小。
唯一可以期待的是,出门问问较早预判了通用大模型的爆发趋势,并进行了一定的技术储备。随着行业势能上来,出门问问会率先从中受益。
但AI大模型已经被越来越多人看作是未来大趋势,当行业达成共识,就意味着更激烈的竞争,先发优势或许会很快被抹平。
出门问问,得先问问自己,能否打赢这场硬仗。
*文中小白、莉莉为化名。返回搜狐,查看更多
责任编辑:
2017-12-25 21:00
来源:
Qualcomm中国
语音助理设备正变得家喻户晓。目前约有 7 亿人在使用 AI 个人助理,到 2021 年预计将增长到近 20 亿人。从 Google Assistant 到亚马逊 Alexa,再到微软 Cortana,AI 个人助理如雨后春笋不断涌现。 三星最近也推出了 Bixby 助手,而 Facebook 预计明年将实现自主虚拟助手(简称“M”)的商业化。
这些设备的工作原理是什么呢?我们该如何利用其功能?它们内置蓝牙、Wi-Fi 模块(如 Qualcomm QCA9377-3)以及移动平台(如 Qualcomm骁龙移动平台)。 在这篇文章中,我们将探讨人工智能设备是如何工作的。
- 1 -
你能用人工智能助手做什么?
个人助理主要有两种:聊天机器人(或基于文本的交互),以及语音用户界面(或语音激活助手),如前面所述的商业产品。 语音激活助手通常是基于命令的 AI 交互- 你需要“唤醒”并给它下达命令。
语音激活助手是日常工作的理想选择,例如:
信息搜索:通过互联网查找信息,比如时间和天气查询等。
任务处理:设置闹钟,发送消息,播放音乐和视频,在线购物,智能家居协调等。
信息收集:呼叫中心收集用户信息,医疗服务提供初步诊断。
技能培训:通过与AI老师交谈来学习一门新的语言。
语音助手可以帮助用户挣脱键盘、屏幕和拼写检查的束缚,尤其适合无障碍需求。
语音助理的硬件组件包括扬声器和麦克风,蓝牙和 Wi-Fi 模块以及标准计算机体系架构(CPU,RAM)。 虽然设备中内置很多技术,但真正的“大脑”通常驻留在云端。
- 2 -
人工智能助手如何工作?
虚拟助手使用一个触发词(“Ok Google”)来“唤醒”,以确保它只在命令下达时才运行。
音频被记录在设备上,经过压缩并通过 Wi-Fi 传输到云端。通常会采用降噪算法来记录音频,以便云端“大脑”更容易理解用户的命令。
使用专有的“语音到文本”平台将音频转换成文本命令。 通过指定的频率对模拟信号进行采样,将模拟声波转换为数字数据。 分析数字数据以确定英语音素(“bb”,“oo”,“sh”等)的出现位置。 一旦识别出音素,就使用统计建模算法(如 Hidden Markhov 模型)来确定特定单词的可能性。
使用自然语言处理(NLP)技术来处理文本以确定所需的操作。该算法首先使用词性标注来确定哪些词是形容词、动词和名词等,然后将这种标记与统计机器学习模型相结合起来,推断句子的含义。
如果命令操作需要进一步的搜索,系统将立即进行搜索。 例如,“OK,Google,什么是 Snapdragon 移动平台?”将触发互联网搜索,并返回所得到的信息。 如果该命令类似于“Ok Google,发送一条消息”,则命令数据(操作:发送消息,收件人:妈妈)会被直接发送到虚拟助理。
“大脑”在云中构建相应的答案,并且从语音样本数据库中检索最佳的输出词,然后将这些词拼接起来形成句子并返回到硬件向用户播放。
- 3 -
骁龙移动平台:实力助力 AI 语音助手
人工智能语音助手正在引领交互方式的转变。Qualcomm骁龙移动平台在智能手机等终端上,对于自然语言处理的人工智能用例具备诸多优势:
同时,Qualcomm骁龙移动平台强大的异构计算能力,保证了人工智能语音助手在终端设备上良好运行。通过在适宜的计算引擎(如CPU、GPU 和 DSP等)上运行各种机器学习任务,我们能提供高效的解决方案。
点击阅读原文,了解让音箱成为智能音箱的Qualcomm智能音频平台。
返回搜狐,查看更多
责任编辑:
智能伙伴本质是什么智能伙伴是飞书全面AI化的一个显性的手段。还有很多看不到的,例如Prompt工程平台、指令系统、插件系统等等。但我认为这些显性手段可以先放一放,就像飞书有很多外部看不懂的改版,有些也改来改去,所以手段并不是最值得分析的,值得分析的是它的源动力——全面AI化(AI-native)。为什么全面AI化如此重要利益相关:笔者是17年初加入飞书,在飞书4年半,经历0-1过程。现在任职于美团。飞书从16年底创立以来,在我看来大概有三波机会:第一波是创立之初,当时希望在G-suite / Slack / Notion 理念的基础上,做IM Base的 All-in-one 在线协作生产力平台,目标全球市场前三。直到18年仍然找不到手感,主要我认为两个原因,①工具并不成熟。②对海外B端市场的进入难度过于低估。具体不展开了。进而转向国内市场,而这套理念在当时有点先进过头了,信息效率这个噱头只对于特定的互联网、新媒体等知识工作者为主的中小团队受用,再想切新的行业就必须和钉钉、企微正面硬刚,陆续加强了aPaas、开放平台的能力,并成立了客户成功团队(LCS),从甲方挖人,快速补齐行业Know-how。这是一个肉搏战,并非字节这样技术驱动,轻资产模式运营公司所擅长的。但可贵的是飞书坚持做了下去。第二波是疫情期间,被迫远程办公让工具对效率问题的改善效果有了非常显著的体感,这是一场难得的社会实验。可惜这波机会的红利大部分让钉钉和企微抢了去,飞书视频会议很不争气的在那个时期还没办法解决更多人在线不掉线的问题。人们需要工具,但对于工具稳定可用易上手的要求,要远高于对看不见摸不着的效率和体验的要求。钉钉就是那个好用到恰到好处的工具。我很长时间都看不上钉钉的设计,感觉非常凌乱,没有一致性。但在美团这样公司自研的角度考虑,可能钉钉的解法,看似简单粗暴,但确实最容易落地和见效的。反观飞书开放的设计,由于过于追求抽象,通用,反而在一些高频场景下对开发者非常不友好。第三波就是大模型。我认为大模型对飞书有以下重大机会:1、飞书是国内知识工作者最欢迎(这不夸张)的产品。大模型最擅长的就是在知识层面提升生产力。2、大模型会提升企业内知识工作者的占比和地位。知识工作者的话语权越高,飞书的价值将更明显。3、AI-native目前大多是个口号,它意味着推翻、重构,甚至是重做一遍。在线协同市场里不太会再有新玩家进入了。AI化只有目前牌桌上的几家有资格聊。而用户规模小,反而可能是一种优势。微软为什么只能做成copilot,就是因为包袱太重,不太可能重做。看完齐俊元和潘乱的对谈,我认为飞书起码是具备这种战略勇气和现实条件。AI化的飞书可以解决哪些第一性问题1)过往工具思维,会更多的把飞书当成信息流动管道,但忽略了信息流动的最终目的——对齐。协作其实是一个对抗“反规模效应”的一种应对策略。当一件事情需要越多的协作节点,效率就会越低。这其中大量的浪费就发生在节点和节点之间的对齐。而这种对齐需求是网状的而非树状或者链式的,这就会导致对齐成本大到无法想象。智能伙伴首先展现出的特性就是用户和他智能伙伴之间的对齐。接下来会有通过A的智能伙伴,让B和A快速对齐。再接下来,A的智能伙伴就可以和B的智能伙伴直接对齐。一旦到达了第三步,理论上对齐将没有成本。2)构建用知识索引信息的平台,而非根据特征索引信息。我们看到的群、群分组、置顶、关键词搜索,都是传统的根据特征和权重来排序的手段,目的是让有价值的信息尽可能前置。但这个排序策略如此的差,使得绝大部分人需要通过过量的阅读包含噪音的信息,来避免自己错过重要消息。当智能伙伴可以和主人充分对齐后,将不需要排序,而是压缩。噪音自动会被压缩掉,有价值的信息,会被萃取出来。9年前Gmail inbox曾经通过算法预测大概率重要的邮件,折叠垃圾邮件。9年后,IM Base的办公产品,可以飞书借助大语言模型,可以预测大概率重要的conversions,甚至是opinions。3)降低成为专家的门槛。我在《张旭:LLM产品第一性原理》中曾评价,midjourney没有抢走艺术家的饭碗,而是让原本就可以有艺术天赋,但不会手绘的人,更低门槛的具象他们的艺术天赋。自动挡的发明让汽车驾驶员不再是一个专门的职业,开车没有那么难。大语言模型加持下的企业,会有更多有好奇心、有使命感、愿意投入的人将可以承担更多的责任和挑战。飞书智能伙伴就是企业内员工能力升格的杠杆。飞书做这件事的风险和挑战大模型的幻觉所带来的可用性问题。潘乱提问:有些人不敢错过重要信息怎么办。而俊元的回答是:我们可以确保大概率不错过重要信息。这是答非所问。在容错率低的场景中,大模型的缺点会放大,会伤害用户的信心。当达到最低可用线之前,有些AI-features就是完全不可用的状态。飞书是否有耐心和魄力,避免无意义消耗用户的期待和信任。信息安全问题。智能伙伴的理念要成立,就要让企业要把所有的数据都灌给飞书,如何让企业放心,安心。没有GUI,如何解决智能伙伴的被魔法攻击。重构工作流如何平衡新旧体验。飞书到底有没有想清楚真正的第一性交互方式,现在看来是打算照着浏览器的范式,借鉴arc再搞一次交互重构。arc是不是足够第一性,我是没太看懂,主要是感觉arc不太nature。核心产品领导层能坚持多久。坦白讲,飞书7发布会之后,我看齐俊元的采访,比看谢欣的采访获得的新认知要更多一些。当然可能他们两个人的分工和视角是不同的,但我仍然认为齐俊元是非常适合去做颠覆性创新的人,我从他的声音中能看到他的勇气,眼里有光。在这个基础上,团队的凝聚力会比以往更强。但这也是一个最大的风险,一这把一旦管理层失去了耐心,泄了气,飞书可能就再难获得这么好的机会了。一些不同观点潘乱:AI给普通工作者的好处和必要性是什么?齐俊元:AI给普通工作者提升效率,最终改善的是体验,心情变愉悦,同时你节省下来的时间,要么你选择产出更多,那么选择做其他自己的事,最重要的是你有了选择,而以往你没得选。张旭:我觉得这个答案可能还是想站在一线工作者的立场,但这个说法还是比较勉强,能这么想的一线工作者就不会问这个问题,问题是大部分人不会这么想问题。绝大多数还是最后意味着做更多的工作——相当于没得选。我认为多B端产品,多站在老板角度总是没错的。工作者要不要用AI,最主要的考虑的因素难道不应该给老板带来更多的价值么?然后才是个人的回报,最后才是成长和愉悦。价值不变、回报不变,成长无边,徒增愉悦是没有意义的。AI我认为在有些阶段是可以同时对于“价值”,“回报”,“成长”,“愉悦”全面buff的。我先抛一个理论,你得到的回报和你承担风险的大小正相关(和你提供的价值,做的事,过往经验,学历背景都无关)。AI可以解放你的一部分生产力,让你可以专注在解决高风险的复杂模糊问题上。那么这个阶段你承担的风险就变高,事实上,你人均给公司贡献的价值也是在提升的,公司应该支付你更高的回报。当你解决的复杂问题更多,你的经验和能力一定比只解决简单问题得到的锻炼更大。最后我们再看愉悦是不是在产品体验上可以得到满足。我为什么说“在有些阶段”呢,因为你承担的越多,并不一定意味着风险就一定越高,算法和模型也会帮助企业分担风险,这部分工作以前是靠堆更有经验的人或者更冗长的流程来解决。那么你承担的风险将回归到接近你的真实能力和经验,市场会在AI时代的人才定价上有比较大的波动。在波动中,永远处于高水位的人才,一定是善于借力大模型的人。所以回答,大模型对一线工作者的好处和必要性。答案其实非常简单,但也非常残忍:老板需要员工掌握大模型,来提供更高的单位生产力,和单位风险承担能力。体现到个体,单位回报是会增加的。掌握大模型的工作者将替代不掌握大模型的工作者。**谢欣**:我们还聊了一些比较远的、纯技术,甚至有一点科幻的问题。我问了一个问题,现在大模型看起来很有智力,像一个只会生物,但是它跟人有一个区别,人生下来,先有智力,然后学习知识,而大模型是先灌输了足够的数据,才拥有了智力。我就很好奇,为什么不一样?有个有意思的答案。感觉上数字的生命体和生物的生命体可能很像,但生物已经进化了很久,人可能是「GPT-1w」了,从最原始的单细胞草履虫,没有智力,(进化)过程中不断地重新 train,每一代 train 一次,相当于把生活中的履历,一定程度上 train 到了下一版本的大脑中,最后构成了现在(人类的智力)。所以,我们看上去,生而拥有的智力,其实是前面无数代 pre-train 进去的,这一点跟大模型很像。张旭:这个观点我确实忍不住要纠正谢欣,其实是有过相关猜想,并且被证伪了。原理很简单① 人的基因能携带的信息大概是3GB,而人和猴子的基因中只有3%是不一样的,大概只有92M,这么大的空间还要负责人类特征之外,几乎不可能再存放一个模型。这个误解,主要源自将大模型和AGI近似等同所导致的,大模型的能力是AGI的一部分,也仅仅是一部分而已。② 人类基因在几万年前就确定基本没变化了,如果基因中存在被压缩的知识,那也是几万年前的知识,预装一个几万年前的训练的知识模型,对人类智慧不会有任何帮助的。假设真的有人基因突变把知识写入自己下一代的基因,自然选择最后会让这些没有收益微小的异类获得竞争劣势而灭亡。总结一下,智能伙伴和飞书7的发布,我获得的两个新认知:对齐是工作协作中的一大成本,AI可以很好的辅助人完成对齐ai-native,不是只有startup能搞,比的就是谁更有勇气。

我要回帖

更多关于 人工智能怎么赚钱 的文章

 

随机推荐