前沿趋势｜从“可用”到“好用”我国AI6163银河官网站大模型产业化发展加速

　　达观数据◆★★◆“曹植◆■◆■★”大语言模型作为国内首批垂直◆★、专用★■★◆★■、自主可控的国产版GPT模型，结合了先进的自然语言处理（NLP）、智能文档处理（IDP）、光学字符识别（OCR）、机器人流程自动化（RPA）等技术，具有长文本★◆■、垂直化和多语言的功能特点。通过创新性地并联多种模型和知识图谱，“曹植”大语言模型为企业提供文档智能审阅、智能知识管理◆★★、知识搜索与问答、文档智能写作■★■、智能推荐等智能化服务★■◆◆■，全方位赋能长文档写作、机器翻译■■、语义分析审核、知识问答★◆■★◆◆、text-to-SQL等语义场景，助推企业数字化与智能化升级■◆◆◆◆，实现智能管控■◆■◆■、降本增效。

　　当前，“ChatGPT”“文心一言■◆”“盘古Chat”等大模型的爆火推动了新一轮人工智能技术发展热潮，AI大模型相关研究、产品不断涌现，中国大模型产业规模快速增长■★。据相关资料分析，中国大模型产业市场规模从2020年的15亿元增长至2022年的70亿元■■★★，年均复合增长率达116.02%，2023年约为147亿元。2024年★■■◆，中国大模型产业规模将达216亿元。

　　随着百度、腾讯、华为■◆、阿里等互联网头部企业竞相布局大模型产业★■◆★★◆，我国AI大模型产业化发展加速。

　　作为由飞腾腾云S2500和国产GPU厂商信创算力服务器协同打造的创新应用◆◆■★◆■，■◆“航旅大模型”以语言大模型为基础，结合民航特色语言知识库★■■◆★，通过大模型训练、行业场景微调、行业场景对齐和大模型运行推理等技术创新，实现多主体、多场景◆■、多阶段知识体系构建★◆◆◆■，为客户提供更加个性化的服务。飞腾公司与合作伙伴联合加速卡厂商，在一个月内完成基于飞腾CPU的服务器与天数智芯加速卡的深度适配◆★◆★■，为“航信大模型”的顺利开发和部署提供坚实的算力底座。

　　由国家网信办联合国家发展改革委、教育部、科技部等七部门公布的《生成式人工智能服务管理暂行办法》自2023年8月15日起施行，办法明确生成式AI实施算法“备案制”，意味着算法备案已成为AIGC产品的入市门槛。2023年11月4日★◆■，网易有道（★■◆“子曰■■■■★■”大模型）、蚂蚁集团（百灵大模型）、面壁智能（“面壁露卡Luca”）、出门问问（★◆★“序列猴子■★★■◆★”）★◆◆★◆■、昆仑万维（“天工”大模型）等约11家企业的AI大模型产品获批★◆，并面向全社会开放服务。加上首批的10余个大模型，目前已有超过20个大模型获得审批。伴随审批落地◆★，多家抢跑■★◆★，AI大模型有望快速进入到拼原生应用■■◆、拼产业落地的阶段◆★◆■■。

　　当前，通用大模型、行业大模型、端侧大模型如雨后春笋般涌现，大模型产业的应用落地将进一步提速。作为新一代人工智能产业的核心驱动力，AI大模型广泛赋能我国经济社会的多个领域，打开迈向通用人工智能的大门■■★，推动新一轮的科技革命与产业变革★◆■。

　　非凡产研发布的《2024年2月全球AIGC行业月报》显示，文心一言以1001万的访问量高居榜首，显示出在个人聊天与助手领域的强大吸引力。月之暗面以297万的访问量和105.80%的环比增长★◆★★■，成为了市场上的一匹黑马，其在个人聊天与助手领域的快速增长，主要得益于独特的产品功能和市场策略。

　　医疗领域超高的专业复杂度，给医疗生成式语言模型的落地应用带来了新的挑战◆★◆■。森亿智能自主研发的病历生成式语言模型◆◆■■★★，可根据患者的信息、跟随医生思路自动灵活扩写病历，包括病情描述、鉴别诊断、治疗方案等信息，边写边生成，无需选择病历模板即可轻松完成病历生成。此外，该模型还可以根据医生的使用目的代入不同角色（交班◆◆★、汇报、出院），以多种角度和方式总结生成病历摘要■★◆◆、治疗建议、出院小结。

　　伴随人工智能领域中大模型技术的快速发展，北京、深圳、杭州■★、上海等地均发布了关于AI大模型的相关政策，加快大模型产业的持续发展◆★。具体来看，北京着力推动大模型相关技术创新，构建高效协同的大模型技术产业生态■◆◆■；上海强调打造具备国际竞争力的大模型；深圳重点支持打造基于国内外芯片和算法的开源通用大模型，支持重点企业持续研发和迭代商用通用大模型。

　　从算盘■★◆★◆、计算机再到大模型，工具的◆■★◆“上新”不断带领人类进入发展新阶段。人工智能时代，意味着将会解放大量的创新能力，更快的创新与技术迭代。在上海浦东软件园，达观数据有限公司（以下简称★★“达观数据”）、上海森亿医疗科技有限公司（以下简称“森亿智能”）和飞腾信息技术有限公司（以下简称★■◆■“飞腾公司”）等优秀企业潜心研发，将技术落地于具体应用场景，打造大模型应用新范式。

　　从开发模式来看，国内高校、科研机构、企业等不同创新主体积极参与大模型研发。我国参数规模在10亿以上的79个大模型中，企业、高校/科研机构、校企联合研发的数量分别为36个、29个、14个，分别占比45.57%、36◆★■■★◆.71%■★◆◆◆■、17.72%，学术界与产业界之间的联合开发仍有较大发展空间。

　　近年来■★，AI大模型得到快速发展，当前大模型热潮主要由语言大模型相关技术引领。语言大模型通过在海量无标注数据上进行大规模预训练，让模型学习大量知识并进行指令微调，从而获得面向多任务的通用求解能力。2023年★■◆★■■，OpenAI多模态预训练大模型GPT-4发布◆■■■◆◆，其具备多模态理解与多类型内容生成能力。2024年，OpenAI发布视频生成大模型Sora，应用时空碎片和扩散Transformer技术，大模型的多模态生成能力进一步成熟。

　　中国AI大模型产业发展源于多领域的广泛需求■◆◆★◆，例如来自办公、制造、金融◆■◆■◆■、医疗、政务等场景中降本增效、生产自动化、降低风险、提高诊断准确率、提高政务服务效率等诉求。相关领域的创新和发展共同推动着中国AI大模型产业的蓬勃发展■★，预示着未来更广阔的市场前景◆★■★。