CES破圈,AI年夜模子“狂飙”在2024
发表时间:2025年01月10日浏览量:
融资方面,依据桔子IT的数据,2024 年 1 月 1 日至 12 月 5 日,海内 AI 范畴共产生 439 起融资案例,总融资额超越 564 亿元国民币,约为客岁的 80%。月均融资金额缺乏 50 亿元,表现出市场对AI投资的谨严立场。
清科研讨核心的统计也表现,往年上半年海内晚期投资、危险投资(VC)、私募股权投资(PE)机构数目同比分辨增加了 23.9%、19.2% 跟 25.2%,反应出投资者在面临AI范畴的高投入跟不断定报答时变得愈加谨严跟感性。
技巧利用方面,2023 年浩繁年夜模子厂商重要专一于优化模子参数、晋升模子机能、争取榜单排名等,盼望成为中国的OpenAI。
但是,进入 2024 年后,行业参加者变得愈加求实,开端愈加存眷 AI 技巧的落地场景跟贸易化利用。市场对年夜模子的“祛魅”进程使得其在现实利用中的范围性逐步浮现,投资者也愈加存眷AI技巧的现实利用后果跟贸易代价,而非纯真的技巧指标跟排名。
这种趋向促使 AI 企业愈加重视产物的适用性跟市场顺应性,推进AI技巧在各个范畴的深刻利用。
市场竞争方面,年夜模子的价钱战贯串了全部 2024 年,每百万 token 的价钱从百元直降至多少厘。这种价钱战不只下降了年夜模子的应用门槛,也对企业的红利形式提出了新的挑衅。
总体来看,2024 年 AI 行业的开展浮现出愈加求实跟感性的特色,市场对AI技巧的存眷点从纯真的技巧指标转向了现实利用跟贸易代价,企业也愈加重视产物的适用性跟市场顺应性,同时市场竞争的加剧也促使企业一直调剂红利形式。
二、翻新 AI 架构,一直出现
在 2024 年,AI 范畴出现出很多翻新架构,这些架构在机能上与传统的 Transformer 模子相媲美,同时在内存效力跟可扩大性方面也表示出明显上风。
Transformer 架构自推出以来,凭仗其自留神力机制(Self-Attention, SA)在天然言语处置、图像天生等义务中获得了宏大胜利。
但是,跟着模子参数的一直增添,Transformer的算力需要跟盘算庞杂性呈指数级增加,这在年夜范围义务中逐步成为瓶颈。
为了应答这一挑衅,寰球范畴内的学者跟研讨职员从多个角度踊跃摸索新的架构计划。
比方,Meta Platforms推出的“影象层”技巧,经由过程引入高效的查问机制,明显下降了模子在存储跟检索数据时的盘算本钱。这种技巧在参数数目仅为1.3亿的基本模子上,增加了128亿的影象参数,使得模子的机能与更年夜范围的模子相称,但盘算所需的算力却年夜幅增加。
别的,混杂专家模子(MoE)也逐步遭到存眷。MoE架构经由过程将模子剖析为多个专家子模子,每个子模子只在特定义务中被激活,从而年夜幅进步了模子的算力效力。
除了这些架构翻新,元始智能的RWKV架构也惹起了普遍存眷。RWKV经由过程将Transformer的高效并行练习与RNN的高效推理才能相联合,实现了在效力跟言语建模才能上的冲破。只管RNN在从前被以为才能弱于Transformer,但RWKV经由过程引入强化进修方式,使得模子可能在须要时从新浏览前文,从而晋升了其影象才能跟团体机能。
这些新架构的出现,不只在技巧上为AI的开展供给了新的可能性,也为处理算力开支成绩供给了无效的处理计划。跟着这些翻新架构的一直成熟跟利用,将来的AI体系将可能更好地均衡机能与资本耗费,推进AI技巧在更普遍的范畴中实现冲破跟利用。
图片起源:量子位《2024年度AI十年夜趋向讲演》
三、模子练习本钱下降
跟着人工智能技巧的疾速开展,AI模子练习本钱始终是业界存眷的重点。2024年,经由过程算法优化、硬件进级跟云盘算效劳的遍及,这一本钱明显下降。
算法优化是下降练习本钱的要害要素之一。比方,DeepSeek v3模子经由过程采取进步的算法优化技巧,仅以557万美元的练习本钱,便到达了与Claude 3.5 Sonnet等顶级模子相媲美的机能。
硬件的进级也为本钱下降供给了坚固基本。跟着GPU等硬件机能的一直晋升,单元盘算才能的本钱逐步降落。DeepSeek v3在练习进程中应用了2048个H800 GPU,仅用了不到2个月的时光就实现了练习,这种硬件提高使得年夜范围模子的练习变得愈加经济高效。
云盘算效劳的遍及为下降练习本钱供给了另一主要道路。云效劳供给商经由过程优化资本调配跟治理,使企业能够依据现实需要机动租用盘算资本,下降了初始投资跟经营本钱。别的,云平台还供给了强盛的数据存储跟处置才能,进一步支撑了AI模子的练习跟安排。
算法优化、硬件进级跟云盘算效劳的遍及独特感化,年夜幅下降了AI模子练习本钱,使得AI技巧愈加经济且进步了模子机能。这使得更多企业跟研讨机构可能累赘得起AI模子的开辟跟利用,推进了人工智能技巧的普遍利用跟翻新。
总之,2024 年 AI 模子练习本钱的明显下降,为人工智能的开展带来了新的机会跟挑衅。跟着技巧的进一步提高,AI模子练习本钱将持续降落,将推进AI技巧在更多范畴的利用跟冲破。
四、RAG,从“全能钥匙”到专攻“小而难”
2024年,RAG(检索加强天生)技巧阅历了明显的架构变更跟市场趋向的改变。
RAG由检索跟年夜模子天生两局部构成,其中心上风在于可能避开年夜模子高低文窗口长度的限度、更好地治理跟应用客户专有的当地材料文件以及把持幻觉。
但是,跟着年夜模子高低文窗口长度的增添,RAG在处理高低文窗口限度方面的上风逐步削弱,但其在治理跟应用专属常识文件以及把持幻觉方面的才能变得愈加主要。
在2024年上半年,市场对AI的冀望是“无所不克不及,年夜而全”,RAG技巧被视为处理庞杂成绩的全能钥匙。
但是,跟着技巧的深刻利用跟现实落地,行业逐步回归感性,开端愈加重视“小而难”的成绩处理。企业开端将年夜模子技巧引入营业中,请求高、需要刚、付费爽直,这使得RAG在营业流程中的“白盒流程多”、“易控”等特色遭到企业客户跟开辟者的青眼。
一个数据表现,RAG架构在企业级AI计划形式中的采取率从31%回升至51%,成为主流趋向。
这一变更反应了RAG技巧在现实利用中的代价逐步浮现,尤其是在企业常识治理体系、在线问答体系跟谍报检索体系等范畴。RAG技巧的利用不只进步了信息检索的正确性跟效力,还为企业供给了愈加特性化跟精准的处理计划。
在技巧层面,RAG的架构也在一直优化跟深入利用。
比方,经由过程进步检索效力、扩大高低文长度跟加强体系鲁棒性等办法,RAG技巧可能更好地处置庞杂的信息检索义务。别的,多模态RAG的呈现将RAG的才能拓展到了文本之外的更辽阔范畴,如图像、视频等,实现了文本跟视觉数据之间的无缝交互。
瞻望将来,RAG的代价将愈加表现在现实利用中,成为推进AI落地的中心引擎。跟着技巧的一直开展跟市场需要的一直变更,RAG技巧将持续在企业级AI利用中施展主要感化,辅助企业更好地治理跟应用常识资本,晋升营业效力跟竞争力。
五、Agent,引领一波新变更
往年下半年,AI Agent(人工智能代办)成为了科技界的热点话题。
寰球科技巨子如微软、苹果、谷歌、OpenAI跟Anthropic等纷纭颁布了相干停顿。在海内市场,百度、阿里、腾讯等企业也接踵推出了各自的智能体平台。
一个数据表现,智能体架构曾经胜利支持了12%的实行名目。
这标明AI驱动的处理计划将经由过程软件完整操纵,从而晋升效力跟机动性。跟着技巧的一直提高,越来越多的企业开端采用AI Agent技巧,以实现更高的主动化程度跟更高效的经营方法。
比方,在批发范畴,AI Agent能够作为购物助手,为用户供给特性化的购物休会。在医疗范畴,Agent技巧可能辅助治理跟剖析医疗记载,进步医疗效劳的效力。
但是,只管AI Agent技巧备受等待,其可托度成绩也激发了普遍的存眷。
年夜型言语模子(LLM)轻易遭到虚伪信息的影响,这可能招致AI Agent在履行义务时呈现过错。为懂得决这一成绩,研讨职员正在摸索多种方式来进步Agent的可托度。
比方,经由过程引入检索加强天生(RAG)技巧,联合外部常识库来领导文本天生,从而进步模子的正确性跟牢靠性。别的,通明的运转进程跟机动的改正机制也是构建可托Agent的主要基本。
六、多模子战略风行
在2024年,企业界呈现了一个明显的趋向:不再依附单一的年夜模子,而是采用求实的多模子战略。这种战略的中心在于依据差别的应用场景跟营业需要,抉择适合的模子停止安排。这种改变不只进步了模子的机动性跟顺应性,还可能更好地满意企业多样化的营业需要。
数据表现,OpenAI的市场份额从50%降落至34%,这标明其先发上风有所削弱。
与此同时,Anthropic的市场份额从12%翻倍至24%,成为重要受益者。Anthropic的Claude系列模子,尤其是最新的Claude 3.5 Sonnet,在多学科综合推理方面的才能明显晋升,吸引了很多企业从GPT-4转向Claude。
这种市场变更反应了企业在抉择AI供给商时,愈加重视模子的保险性、价钱、机能跟扩大功效。
多模子战略的崛起,使得企业在面临庞杂的营业场景时,可能愈加机动地抉择跟组合差别的模子。
比方,在金融效劳范畴,企业可能须要一个可能处置庞杂数据跟严厉法例的模子,而在媒体跟文娱范畴,则须要一个可能天生高品质内容的模子。经由过程多模子战略,企业能够在差别的营业部分跟利用场景中,抉择最合适的模子来进步效力跟后果。
别的,多模子战略还增进了企业外部的技巧翻新跟合作。企业能够依据本身的营业需要,开辟跟优化特定的模子,从而在竞争中取得上风。比方,一些企业经由过程年夜模子与小模子的协同任务,实现了更高效的营业流程跟更好的用户休会。
总体来看,多模子战略的风行不只转变了AI市场的竞争格式,也为企业的数字化转型供给了新的思绪跟方式。跟着技巧的一直提高跟利用的深刻,这种战略将持续推进企业翻新跟开展,为企业发明更多的贸易代价。
七、具身智能,站上C位
2024年,具身智能作为人工智能范畴的一个主要分支,逐步成为研讨跟利用的热门。
在一样平常生涯中,具身智能的利用曾经初露眉目。
比方,智能扫地呆板人可能经由过程感知四周情况,主动计划干净门路,防止碰撞阻碍物,高效实现干净义务。主动驾驶汽车在现实途径测试中也展示出与人类驾驶员类似的驾驶才能,可能辨认交通讯号、行人跟车辆,做出及时的驾驶决议。
人形呆板人也被以为是实现具身智能的幻想平台之一。
详细来看,其不只可能模拟人类的表面,还能经由过程集成进步的传感器跟算法,履行愈加庞杂的义务。
跟着技巧的一直提高,具身智能在多个范畴展示出其奇特的代价跟潜力。在产业范畴,具身智能呆板人能够进步出产效力跟保险性,履行庞杂的拆卸、搬运跟检测义务。在效劳业,它们能够供给愈加高效跟特性化的效劳,如旅店前台招待、餐厅效劳等。
别的,具身智能还在摸索新的利用场景,如在灾祸救济中取代人类进入伤害地区停止搜救。
只管具身智能在技巧上获得了明显停顿,但仍面对一些挑衅。
比方,硬件的稳固性跟本钱成绩、多模态数据的整合与处置、以及在庞杂情况中的顺应才能等。但是,跟着研讨的深刻跟技巧的冲破,这些成绩无望逐渐失掉处理,具身智能将在更多范畴实现贸易化利用。
总之,具身智能作为人工智能与呆板人技巧的联合体,正逐渐转变人们的生涯跟任务方法。它不只为人类供给了愈加智能跟便捷的效劳,也为各行各业的开展带来了新的机会跟挑衅。
八、向量数据库逐步“替换”传统数据库
向量数据库作为一种新兴的数据库技巧,比年来在人工智能范畴敏捷突起,逐步成为传统数据库的主要弥补乃至替换者。
与传统数据库差别,向量数据库经由过程将数据转化为向量情势,可能更准确地表现数据的特点或种别,从而实现高效的类似性搜寻跟范畴查问。
跟着人工智能技巧的飞速开展,特殊是年夜模子的普遍利用,向量数据库的需要也在一直增添。年夜模子平日须要处置大批的高维数据,向量数据库可能无效地支撑这些数据的存储跟检索。
比方,天生式AI跟检索加强天生(RAG)架构等利用,都须要向量数据库来存储跟检索大批的常识库嵌入。
一组数据表现,2024年,寰球数据库市场范围初次冲破千亿美金,到达约1010亿美元,此中中国数据库市场范围为74.1亿美元,占寰球的7.34%。
这一数据标明,向量数据库作为新兴技巧,正在逐步成为数据库市场的主要构成局部。
现在,寰球数据库供给商数目为167家,产物数目到达269款。跟着技巧的一直开展跟市场需要的增添,估计向量数据库的市场份额将持续扩展。
向量数据库的市场趋向也表现出其宏大的开展潜力。一方面,向量数据库与传统数据库的融会正在一直加深,很多传统数据库厂商也开端逐渐集成向量检索的才能。另一方面,向量数据库的本钱也在逐步降落,估计将来多少年将呈现3-5倍的本钱降落。这将进一步推进向量数据库在各个行业的利用跟遍及。
总之,向量数据库凭仗其在处置高维数据跟非构造化数据方面的奇特上风,正在逐步转变传统数据库市场的格式。跟着人工智能技巧的一直开展,向量数据库的利用远景将愈加辽阔,无望在更多范畴施展主要感化。
九、多模态模子成为2024赛点
2024年,多模态才能已成为AI年夜模子的基础标配。多少乎全部重要的模子供给商都宣布了多模态模子,可能处置图像、音频跟视频输入。
比方,字节跳动在2024年推出了 PixelDance 跟 Seaweed 两款视频天生模子,这些模子在视频天生的品质跟效力上都有明显晋升。
腾讯的混元年夜模子也在2024年进级为混杂专家模子(MoE)架构,参数范围达万亿,善于处置庞杂场景跟多义务场景。
智象将来科技无限公司在2024年12月宣布了智象多模态天生年夜模子3.0版,该模子在图像跟视频天生才能上实现了片面进级。
科年夜讯飞的讯飞星火年夜模子4.0 Turbo也在多模态利用中表示杰出,支撑多语种语音辨认跟高度拟人化的语音分解才能。
这些多模态模子的宣布不只推进了技巧的提高,还为现实利用带来了新的可能性。
比方,多模态模子能够用于更庞杂的场景懂得,如经由过程图像跟音频的联合来更好地舆解用户的需要跟用意。别的,多模态天生才能的晋升也使得天生高品质的图像跟视频内容变得愈加轻易。
跟着多模态模子的遍及,其利用场景也在一直扩大。在教导范畴,多模态模子能够用于开辟更具互动性的进修东西,经由过程图像跟音频的联合来进步进修后果。在医疗范畴,多模态模子能够辅助大夫更好地剖析医学影像跟患者数据。在文娱跟创意工业,多模态天生模子能够用于创作新的艺术作品跟影视内容。
十、从年夜到小,从通用到垂直
2024年,小模子在特定范畴展示出了明显的上风。
这些小模子因其较低的盘算庞杂度跟资本耗费而备受青眼,尤其是在资本受限的情况中,如挪动装备跟边沿盘算节点。它们不只可能高效运转,并且每每针对特定义务停止了优化,使得在某些利用场景下,它们的表示乃至能与年夜型模子相媲美,偶然还能超出。
别的,小模子的可说明性更强,更易于用户懂得跟接收。以 OpenAI 的 GPT-4o mini 为例,只管本钱下降,但其机能却失掉了晋升,这得益于数据集跟练习方式的改良。
在特定范畴,垂直模子也展示出了超出通用模子的才能。
比方,在执法征询、化工研讨跟医疗效劳等范畴,定制化的AI模子可能更深刻地舆解跟处置专业常识,供给更正确跟有针对性的效劳。
这些专业模子不只有助于处理行业内特有的成绩,还增进了相干行业的疾速开展。跟着各行业对AI技巧需要的增加,估计将来将有更多垂直模子呈现,进一步推进各行业的智能化转型。
这些模子的呈现,标记着AI技巧正朝着更精致化、专业化的偏向开展,为各行各业带来更高效的处理计划。
写在最后:
从市场对年夜模子的“祛魅”到翻新AI架构的出现,再到模子练习本钱的下降,2024这一年,见证了AI技巧的疾速开展跟利用场景的扩大。
RAG技巧从“全能钥匙”改变为专一于处理“小而难”的成绩,而AI Agent(智能体)技巧则引领了一波新的变更。
多模子战略的风行跟具身智能的存眷度晋升,进一步推进了AI技巧在各个范畴的利用。
向量数据库的崛起跟多模态模子的遍及,标记着AI技巧在处置非构造化数据跟多模态信息方面的才能加强。
最后,从小模子在特定范畴的明显上风到垂直模子的超出通用模子的才能,AI技巧正朝着更精致化、专业化的偏向开展,为各行各业带来更高效的处理计划。
这一年的开展不只展现了AI技巧的潜力,也为将来的智能化转型奠基了坚固的基本。前往搜狐,检查更多
义务编纂: