“曹植”大语言模型是如何诞生的?来看达观数据CTO的讲述
创始人
2024-05-08 12:06:05
0

原标题:“曹植”大语言模型是如何诞生的?来看达观数据CTO的讲述

“曹植”大语言模型是如何诞生的?来看达观数据CTO的讲述

“曹植七步成诗,他写的最著名的篇章《洛神赋》就是古代文学作品里典型的首屈一指的长文本。这也是‘曹植’大模型的专长,做长文档资料智能化的分析写作工作。”2023年世界人工智能大会(以下简称“WAIC2023”)上,达观数据董事长陈运文正式发布“曹植”垂直领域大语言模型(以下简称“曹植”大模型)时如此介绍道。

这是国内首个垂直行业专用的自主可控的国产GPT大语言模型,可准确完成多类型、复杂结构的长文本写作,自动起草多种类型的文档,未来将实现多模态内容生成,如长文档中的表格、图表、图片等。那么“曹植”是如何诞生的呢?来听达观数据CTO纪达麒的讲述。

深耕NLP领域

达观数据成立于2015年,成长于上海浦东软件园,其创始团队都是与中国文字打过十几年交道的程序老兵,并深耕于NLP(自然语言处理)领域。今年3月,随着垂直、专用、自主可控的国产版ChatGPT“曹植”大模型的发布,达观数据正不断推动着NLP技术向不同行业领域深度结合。

NLP被誉为AI皇冠上的明珠。从互联网拓宽至更广泛行业,达观数据在金融、政务、制造等行业积累了垂直领域的大量数据、人才与NLP传统架构。在与来自金融、政务、制造等行业的客户进行了广泛的交流后,达观数据联合创始人、CTO纪达麒逐渐发现,NLP技术在办公文档方面有着广阔的应用前景。

2017年,谷歌发表的论文中提出,NLP关于“理解”和“生成”的两个技术路线。“基于达观数据当时的优势资源和未来发展,我们一开始就选择了‘理解’这条技术路线。”纪达麒介绍。这一年,纪达麒和研发团队运用知识图谱、文字识别等技术开发的IDP智能文档审阅系统进入市场。

随着人工智能的不断发展,机器智能处理长文本的需求日益紧迫。随后,达观数据便投入到大语言模型的开发工作中,纪达麒担任该项目总负责人。这就是如今的“曹植”大模型诞生的起点。

“培养”出人工智能版“曹植”

“我们想‘培养’出人工智能版的‘曹植’,希望它能像我国的历史名人曹植一样快速地生成长文本。”提及“曹植”大模型这一名称的由来,纪达麒笑言,“这是我们员工在四五十个名字中票选出来的。”

“长文本”是“曹植”大模型的目标任务。区别于一问一答的简单短文本生成,“曹植”大模型可准确完成多类型、复杂结构的长文本写作,自动起草多种类型的文档,同时具有自动排版、智能纠错、文本润色、自动生成摘要等特色功能;还可实现多模态内容生成,比如长文档中的表格、图表、图片等;支持中文、英文、法语、德语、日语、韩语等数十种语言的写作,辅助人工大幅提高办公效率;在长文档翻译方面,对原文的标题、段落等内容实现1:1版式还原,提供实时的翻译体验,广泛应用于多语言文档密集处理的场景。

这也是国内大规模语言模型中首批可落地的产业应用级模型,目前已在金融领域AIGC多场景投入应用。基于“曹植”系统,“曹植”大模型进一步夯实了达观数据产业应用智能化基座,全面增强AI全产品矩阵能力。

文字:路小雨

编辑:吴燕

资料:区科经委

* 转载请注明来自浦东发布官方微信

相关内容

原创 ...
昆仑银行"断腕"村镇银行:一场无奈的资本撤退 四川金融监管局的一纸...
2026-03-20 06:52:33
从“帮销”到“共兴”,上海...
今天起,一场跨越山海、融合花香与烟火气的春日盛宴——2026年上海...
2026-03-20 06:52:18
预售新规看似利好,漏洞仍需...
最近地方政府关于房地产预售制度的调整,在朋友圈里引来了不少讨论,大...
2026-03-20 06:50:02
三星电子计划2026年向A...
IT之家 3 月 19 日消息,三星电子在今日股东大会后公布的文件...
2026-03-20 06:46:28
时间不再是普通人的朋友
来源:虎嗅APP 一、AI压缩的正是时间 中文互联网流行一句话:...
2026-03-20 06:44:09
不清仓将被强制处理?金价波...
3月19日,国际金价再度大幅下挫,伦敦金盘中跌超2.4%,跌破47...
2026-03-20 06:43:24
华住集团2025年营收增长...
图片来源:视觉中国 蓝鲸新闻3月19日讯(记者 孙煜)一年新开24...
2026-03-20 06:40:38
雷军小米SU7发布会请来“...
IT之家 3 月 19 日消息,在今天晚间的小米春季新品发布会上,...
2026-03-20 06:38:22
雷军的“新朋友圈”
今天,小米新一代SU7发布,正式发布会之前,雷军照常在休息间/贵宾...
2026-03-20 06:37:07

热门资讯

晓风书屋重启后 首场读书分享会...   福州晓风书屋重启后的首场读书分享活动,将于22日(周日)举行。届时,中国政法大学政治与公共管理学...
真的尽力了!现场实拍赛后吴海燕... 真的尽力了!现场实拍赛后吴海燕落泪谢场
学车、网购、报班遇坑怎么办? ... 近日,在第44个“国际消费者权益日”来临之际,闽侯法院召开新闻发布会,通报司法保护消费者权益情况,并...
春分巧遇“龙抬头” 福州气温“...   “社日双飞燕,春分百啭莺。”20日迎来春分节气。这一天,一些市民会玩竖蛋游戏以及选择理发。  “...
省人大常委会今年立法监督工作计...   记者3月19日获悉,省人大常委会今年工作要点和立法、监督、代表工作计划日前印发。今年省人大常委会...
假如3.20后开始备考26CP... 2026年CPA考试备考即将开启,备考策略与信息成为考生们关注的焦点。为了帮助大家更好地准备这项重要...
美作为石油净出口国为何担心油价... 美以伊的冲突造成国际能源供应出现危机,油价大幅上涨。最近,美国采取了好几项措施来遏制油价上涨。美国现...
原来对花粉不过敏,为何今年过敏... 人民日报海外版北京3月19日电(记者王美华)当前正值花粉季,有人纳闷,为什么我原来花粉不过敏,今年过...
前两月工业增速超预期,下阶段走... 来源:第一财经 在出口强劲和稳增长政策落地显效的带动下,今年前2个月,工业生产增速明显加快,成为经济...
校长如何破解美育浸润实施难题 南京师范大学附属实验学校的教师在指导学生写生。 李春楠 摄 《教育部关于全面实施学校美育浸润行动的通...