前沿趋势|从“可用”到“好用”我国AI6163银河官网站大模型产业化发展加速

2024-10-14

  达观数据◆★★◆“曹植◆■◆■★”大语言模型作为国内首批垂直◆★、专用★■★◆★■、自主可控的国产版GPT模型,结合了先进的自然语言处理(NLP)、智能文档处理(IDP)、光学字符识别(OCR)、机器人流程自动化(RPA)等技术,具有长文本★◆■、垂直化和多语言的功能特点。通过创新性地并联多种模型和知识图谱,“曹植”大语言模型为企业提供文档智能审阅、智能知识管理◆★★、知识搜索与问答、文档智能写作■★■、智能推荐等智能化服务★■◆◆■,全方位赋能长文档写作、机器翻译■■、语义分析审核、知识问答★◆■★◆◆、text-to-SQL等语义场景,助推企业数字化与智能化升级■◆◆◆◆,实现智能管控■◆■◆■、降本增效。

  当前,“ChatGPT”“文心一言■◆”“盘古Chat”等大模型的爆火推动了新一轮人工智能技术发展热潮,AI大模型相关研究、产品不断涌现,中国大模型产业规模快速增长■★。据相关资料分析,中国大模型产业市场规模从2020年的15亿元增长至2022年的70亿元■■★★,年均复合增长率达116.02%,2023年约为147亿元。2024年★■■◆,中国大模型产业规模将达216亿元。

  随着百度、腾讯、华为■◆、阿里等互联网头部企业竞相布局大模型产业★■◆★★◆,我国AI大模型产业化发展加速。

  作为由飞腾腾云S2500和国产GPU厂商信创算力服务器协同打造的创新应用◆◆■★◆■,■◆“航旅大模型”以语言大模型为基础,结合民航特色语言知识库★■■◆★,通过大模型训练、行业场景微调、行业场景对齐和大模型运行推理等技术创新,实现多主体、多场景◆■、多阶段知识体系构建★◆◆◆■,为客户提供更加个性化的服务。飞腾公司与合作伙伴联合加速卡厂商,在一个月内完成基于飞腾CPU的服务器与天数智芯加速卡的深度适配◆★◆★■,为“航信大模型”的顺利开发和部署提供坚实的算力底座。

  由国家网信办联合国家发展改革委、教育部、科技部等七部门公布的《生成式人工智能服务管理暂行办法》自2023年8月15日起施行,办法明确生成式AI实施算法“备案制”,意味着算法备案已成为AIGC产品的入市门槛。2023年11月4日★◆■,网易有道(★■◆“子曰■■■■★■”大模型)、蚂蚁集团(百灵大模型)、面壁智能(“面壁露卡Luca”)、出门问问(★◆★“序列猴子■★★■◆★”)★◆◆★◆■、昆仑万维(“天工”大模型)等约11家企业的AI大模型产品获批★◆,并面向全社会开放服务。加上首批的10余个大模型,目前已有超过20个大模型获得审批。伴随审批落地◆★,多家抢跑■★◆★,AI大模型有望快速进入到拼原生应用■■◆、拼产业落地的阶段◆★◆■■。

  当前,通用大模型、行业大模型、端侧大模型如雨后春笋般涌现,大模型产业的应用落地将进一步提速。作为新一代人工智能产业的核心驱动力,AI大模型广泛赋能我国经济社会的多个领域,打开迈向通用人工智能的大门■■★,推动新一轮的科技革命与产业变革★◆■。

  非凡产研发布的《2024年2月全球AIGC行业月报》显示,文心一言以1001万的访问量高居榜首,显示出在个人聊天与助手领域的强大吸引力。月之暗面以297万的访问量和105.80%的环比增长★◆★★■,成为了市场上的一匹黑马,其在个人聊天与助手领域的快速增长,主要得益于独特的产品功能和市场策略。

  医疗领域超高的专业复杂度,给医疗生成式语言模型的落地应用带来了新的挑战◆★◆■。森亿智能自主研发的病历生成式语言模型◆◆■■★★,可根据患者的信息、跟随医生思路自动灵活扩写病历,包括病情描述、鉴别诊断、治疗方案等信息,边写边生成,无需选择病历模板即可轻松完成病历生成。此外,该模型还可以根据医生的使用目的代入不同角色(交班◆◆★、汇报、出院),以多种角度和方式总结生成病历摘要■★◆◆、治疗建议、出院小结。

  伴随人工智能领域中大模型技术的快速发展,北京、深圳、杭州■★、上海等地均发布了关于AI大模型的相关政策,加快大模型产业的持续发展◆★。具体来看,北京着力推动大模型相关技术创新,构建高效协同的大模型技术产业生态■◆◆■;上海强调打造具备国际竞争力的大模型;深圳重点支持打造基于国内外芯片和算法的开源通用大模型,支持重点企业持续研发和迭代商用通用大模型。

  从算盘■★◆★◆、计算机再到大模型,工具的◆■★◆“上新”不断带领人类进入发展新阶段。人工智能时代,意味着将会解放大量的创新能力,更快的创新与技术迭代。在上海浦东软件园,达观数据有限公司(以下简称★★“达观数据”)、上海森亿医疗科技有限公司(以下简称“森亿智能”)和飞腾信息技术有限公司(以下简称★■◆■“飞腾公司”)等优秀企业潜心研发,将技术落地于具体应用场景,打造大模型应用新范式。

  从开发模式来看,国内高校、科研机构、企业等不同创新主体积极参与大模型研发。我国参数规模在10亿以上的79个大模型中,企业、高校/科研机构、校企联合研发的数量分别为36个、29个、14个,分别占比45.57%、36◆★■■★◆.71%■★◆◆◆■、17.72%,学术界与产业界之间的联合开发仍有较大发展空间。

  近年来■★,AI大模型得到快速发展,当前大模型热潮主要由语言大模型相关技术引领。语言大模型通过在海量无标注数据上进行大规模预训练,让模型学习大量知识并进行指令微调,从而获得面向多任务的通用求解能力。2023年★■◆★■■,OpenAI多模态预训练大模型GPT-4发布◆■■■◆◆,其具备多模态理解与多类型内容生成能力。2024年,OpenAI发布视频生成大模型Sora,应用时空碎片和扩散Transformer技术,大模型的多模态生成能力进一步成熟。

  中国AI大模型产业发展源于多领域的广泛需求■◆◆★◆,例如来自办公、制造、金融◆■◆■◆■、医疗、政务等场景中降本增效、生产自动化、降低风险、提高诊断准确率、提高政务服务效率等诉求。相关领域的创新和发展共同推动着中国AI大模型产业的蓬勃发展■★,预示着未来更广阔的市场前景◆★■★。